[j wer 


Ee 


i 
i a 


"v 
NODIS 
See 

ar SS 
D. v 
IHR 


puniti 


" [un 


华章 教育 


PEARSON: 





Thomas A. Sudkamp # jus 等 译 


[homas A. Sudkamp 





, pow 
Languages aid Machines 


An Introduction to the Theory of Computer Science 


| , 
74 Third Edition 


A 


机 械 工 业 出 版 社 


China Machine Press 





REESE; ES 计算 机 科学 理论 导论 ( 原 书 第 3 版 ) 


理论 计算 机 科学 是 推动 计算 机 技术 和 应 用 向 前 发 展 的 巨大 动力 。 形 式 语 言 、 自 动机 、 
可 计算 性 、 计 算 复杂 性 和 相关 方面 内 容 构成 的 计算 理论 ， 是 理论 计算 机 科学 的 基础 内 容 之 
一 。 本 书 由 美国 莱特 州立 大 学 计算 机 科学 及 工程 系 的 Thomas A. Sudkamp 教 授 编 写 ， 是 介 
绍 这 些 内 容 的 优秀 教材 。 

全 书 不 仅 介 绍 了 计算 机 科学 的 基础 ， 探 讨 了 算法 计算 的 能 力 和 局 限 ， 而 且 还 通过 概念 
的 严格 表述 ， 以 及 使 用 通俗 的 例子 来 解释 定理 ， 从 而 帮助 学 生 提高 数学 论证 能 力 。 书 中 每 
章 后 面 都 有 一 些 练习 ， 通 过 这 些 练习 使 学 生 加 深 对 本 章 内 容 的 理解 。 


第 三 版 亮点 : 
e 超过 100 个 新 的 习题 和 示例 
e 强调 问题 表述 和 问题 归 约 的 重要 性 
e 显著 地 扩展 了 计算 复杂 性 的 覆盖 面 
e 增加 了 用 问题 归 约 证 明 NP 完 全 性 的 章节 
e 处 理 NP 完 全 问题 时 给 出 了 近似 算法 


作 是 美国 莱特 州立 大 学 计算 机 科学 
z| [homas A. SudkamD sier se mugs 
8 | 广泛 ， 包 括 近似 推理 、 人 工 智能 、 数 理 远 辑 、 建 模 软 计算 的 应 用 、 复 杂 问题 领域 
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的 决策 制定 以 及 不 确定 、 不 精确 信息 和 知识 发 掘 的 机 器 学 习 。Sudkamp 教 授 目 前 
还 担任 IEEE Transactions on System, Man, and Cybernetics 和 1IEEE 
Transactions on Fuzzy Systems 的 副 编辑 ，International Journal of Approximate 
Reasoning 和 Fuzzy Sets and Systems 的 领域 编辑 。 他 也 曾经 担任 过 北美 模糊 信 
息 处 理 协 会 (NAFIPS) 的 主席 以 及 国际 模糊 系统 联盟 (IFSA) 的 副 主 席 。 
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本 书 是 计算 理论 方面 的 优秀 教材 之 一 ， 包 括 上 下 文 无 关 文法 、 上 下 文 无 关 文法 范式 、 
有 限 自 动机 乾 正 则 语 高 的 性 质 、 下 推 自动 机 和 区 下文 无 关 语 言 、 图 灵机 、 图 灵 可 计算 函 
数 、 乔 姆 斯 基层 人 次、 判定 问题 与 丘 奇 图 灵机 、 不 可 判定 性 、Mu= 递 归 孙 数 :- 时 间 复 杂 性 、 
库 克 定理 、NP= 完 谷 间 题 、LL(IkX 法 以 及 LR(K) 文 法 等 问题 = 本 书 不 仅 介绍 了 计算 机 科 
学 的 基础 ， 而 目 通过 概念 的 严格 表述 ， 以 及 使 用 通俗 的 例子 来 阐释 定理 ， 从 而 帮助 学 生 提 
高 数学 论证 能 力 以 及 对 计算 理论 知识 的 全 面 深 入 的 理解 。 书 中 每 章 后 面 都 有 附 有 大 量 习 
题 ， 通 过 完成 这 些 习 题 ， 学 生 可 以 加 次 对 本 澡 内 容 的 理解 

本 书 可 以 用 作 评 算 机 科学 、 计 算 机 工程 及 其 相关 专业 的 教 林 辣 也 可 以 作为 从 事 计算 理 
论 、 形 式 语言 以 及 计算 机 系统 研发 的 研究 人 员 和 工程 技术 人 员 的 参考 书 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ;也 正 是 这 样 的 传统 ,使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 辟 
划 了 研究 的 范畴 ， 还 揭 殉 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ,， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因此 ,引进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 透 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum，Stroustrup Kernighan, 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 废 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 襄 助 ， 国内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 入 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
全美 经 典 学 习 指 导 系列 ”。 为 了 保证 这 三 套 丛 书 的 权威 性 ， 同时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 和 科学院、 北京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 AHX*T. E 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西安 交通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑州 大 学 、 湖 
北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意 见 和 出 版 监督 。 

这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 


的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. L T., Stanford, U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工 程 、 图 形 学 、 通 信 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 :. 有 的 历经 三 十 年 而 不 衰 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 人 室 。 i 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 


LEA 
BRE 
RB & 
BRR 
X 
高 传 普 
LER 


专家 指导 委员 会 


( 按 姓氏 笔画 顺序 ) 


2x 
ThE 
李 师 贤 
Fs di iA 
至 小 峰 
钟 玉 琢 
程 Ju 


RR A 
KHL, 
李 建 中 
陈 向 群 
项 丽华 
唐 世 渭 
AZ WY Hi, 


RRR 
RAT 
杨 冬 青 
周 伯 生 
i Bj 
JR A= 


zs Bo 


理论 计算 机 科学 是 推动 计算 机 技术 和 应 用 向 前 发 展 的 巨大 动力 。 形 式 语言 、 自 动机 、 可 计算 性 、 
计算 复杂 性 以 及 相关 内 容 构成 的 计算 理论 ， 是 理论 计算 机 科学 的 基础 内 容 之 一 。 学 习 、 研 究 这 些 内 
容 ， 不 仅 为 进一步 学 习 、 研 究 理论 计算 机 科学 打下 基础 ， 而 且 对 增强 形式 化 能 力 和 推理 能 力也 有 帮助 
作用 ;这 些 能 力 对 从 事 计 算 机 技术 中 的 形式 化 方法 、 技 术 等 研究 ， 是 不 可 缺少 的 。 

本 书 是 由 美国 莱特 州立 大 学 计算 机 科学 及 工程 系 的 Thomas A. Sudkamp 教授 编写 的 高 等 学 校 教材 
主要 介绍 形式 语言 、 自 动机 、 可 计算 性 、 计 算 复 杂 性 和 上 下 文 无 关 语言 的 确定 性 分 析 等 内 容 。 本 书 不 
仪 介绍 了 计算 机 科学 的 基础 ， 而 且 通 过 概念 的 严格 表述 ， 以 及 使 用 通俗 的 例子 来 阐释 定理 ， 从 而 期 望 
能 够 帮助 学 生 提高 数学 论证 能 力 以 及 对 计算 理论 知识 的 全 面 深 入 的 音 解 。 书 中 每 章 后 面 都 有 大 量 习 
种， 通过 完成 这 些 习 题 ， 学 生 可 以 加 深 对 本 章 内 容 的 理解 。 本 书 是 理论 计算 机 科学 的 优秀 教材 之 一 

本 书 可 以 用 作 计算 机 科学 、 计 算 机 工程 及 其 相关 专业 的 教材 ， 也 可 以 作为 从 事 计算 理论 ， 形式 语 
言 以 及 计算 机 系统 研发 的 研究 人 员 和 工程 技术 人 员 的 参考 书 。 

引进 国外 的 优秀 计算 机 教材 ， 对 我 国 的 计算 机 教育 事业 的 发 展会 起 到 积极 的 推动 作用 ， 也 是 与 世 
界 接轨 、 建 立 世界 一 流 大 学 不 可 缺少 的 条 件 之 一 。 我 们 把 本 书 介绍 给 国内 从 事 计 算 机 教育 事业 的 同行 
们 ， 以 供 参 考 。 

参加 本 书 翻译 的 有 : 孙 家 骗 同 志 ， 负 责 各 章 译 稿 的 详细 修改 和 全 囊 的 统 稿 ; 郝 丹 同志 人 负责 第 .1 到 
第 4 章 及 前 言 的 翻译 ; 刘 江 红 同 志 负 责 第 5 到 第 7 章 的 翻译 ， 程 邵 研 同志 负责 第 8 到 第 10 章 的 翻译 ; 
FRA ARTS 11 到 第 13 章 的 翻译 ， 侯 姗 姗 同志 负责 第 14 到 第 17 章 的 翻译 ， 黄 晓 晨 同志 负责 第 18 
到 第 20 章 及 附录 的 翻译 。 

由 于 我 们 的 能 力 有 限 ， 难 免 有 不 当 之 处 ， 敬 请 读者 不 音 赐教 。 


译 者 
2007 年 4 月 
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前 


本 书 第 3 版 的 出 版 目的 与 前 两 版 相同 ;其 介 绍 计算 科学 理论 ， 从 而 为 计算 机 专业 的 初级 和 中 级 学 
生 提 供 计算 机 科学 理论 的 健全 的 数学 表示 。 促使 我 对 上 一 版 进行 更 新 的 原因 有 三 个 : 通过 提供 附加 的 
动机 介绍 和 例子 来 增强 表达 效果 ; 扩大 知识 范围 , 特别 是 在 计算 复杂 性 这 一 领域 ; 为 教师 讲授 计算 机 
科学 理论 的 课程 提供 更 多 的 灵活 性 。 

许多 面向 应 用 领域 的 学 生 质 疑 学 习 理 论 基础 知识 的 重要 性 。 然 而 ， 正 是 这 门 课 强 调 了 计算 机 科学 
间 题 的 宕 观 视图 。 现 在 的 编程 语言 和 计算 机 体系 结构 很 陈旧 ， 另 外， 与 此 相关 的 大 家 感 兴趣 的 问题 都 
已 经 找到 了 相应 的 解决 方案 ; 本 书 中 的 很 多 内 容 都 与 这 些 相 关 什么 类 型 的 模式 可 以 用 某 种 算法 识 
别 ? 语言 如 何 被 形式 化 地 定义 和 分 析 ? 算法 计算 的 固有 能 力 和 局 限 性 是 什么 ? 有 哪些 问题 的 解决 方法 
Seu c cT 
都 将 逐一 论 


组 织 


由 于 绝 大 多 数 本 科 计 算 机 科学 专业 的 学 生 都 没有 或 缺少 足够 的 抽象 数学 的 基础 知识, 因此 本 书 不 
仅 介 绍 计 算 机 科学 的 基础 ， 而 且 希 望 能 够 提高 常生 的 数 党 论证 能 力 。 我 们 通过 概念 的 严格 表述 ， 以 及 
使 用 通俗 的 例子 来 解释 一 些 定理 ,来 达到 上 述 目的 。 每 章 最 后 都 有 一 些 练习 ， 从 而 强化 和 加 深 对 本 章 
内 容 的 理解 。 

为 了 便于 大 家 学 习 ， 我 们 假设 大 家 都 没有 特殊 的 数学 预备 知识 。 因 而 ， 第 1 童 介绍 计算 理论 的 数 
学 工具 : 基本 集合 理论 、 递 归 定 义 以 及 数学 归纳 证 明 。 除 了 1.3 节 和 1.4 节 介 绍 的 特殊 内 容 外 , 第 1 
章 和 第 2 章 介绍 了 覆盖 全 书 的 基础 知识 。1. 3 节 介 绍 基数 和 对 角 化 。 它 们 被 用 在 构造 不 确定 语言 和 不 
可 计算 方法 的 存在 性 证 明 中 。1:4 节 检查 反 证 法 中 的 自 引用 的 使 用 。 这 种 技术 用 在 不 确定 性 证 明 中 ， 
包括 证 明 停 机 问题 无 解 。1 对 于 那些 已 经 学 完 离散 数学 课程 的 学 生 , 第 工 章 的 大 部 分 内 容 可 以 看 作 是 对 
这 些 知 识 的 复习 。 

考虑 到 计算 基础 的 不 同 课程 可 以 强调 不 同 的 主题 ， 本 书 的 表述 和 组 织 方式 设计 为 允许 一 门 课程 深 
和 人 探究 某 些 特殊 主题 ， 同 时 提供 一 种 加 强 对 主要 主题 的 研究 能 力 ， 这 种 能 力 通过 介绍 和 深入 探讨 计算 
机 科学 理论 研究 范围 的 材料 来 获取 。 课 程 的 核心 内 容 集中 于 形式 化 的 自动 机 语言 理论 的 经 典 表示 ， 可 
计算 性 和 不 确定 性 、 计 算 复杂 性 ， 以 及 作为 编程 语言 定义 和 编译 器 设计 基础 的 形式 化 语言 ， 详 见 下 面 
表格 。 小 节 后 面 的 是 号 表示 这 部 分 内 容 可 以 略 过 但 并 不 影响 整 本 书 表 述 的 连贯 性 。 带 星 号 的 小 节 通 常 
包括 应 用 的 表示 N 相关 主题 的 介绍 或 是 主题 中 一 个 复杂 结论 的 详细 证 明 。 


形式 语言 和 自动 机 理论 . 计算 理论 “计算 复杂 性 编程 语言 的 形式 语言 
第 1 章 : H=3; 6-8 第 1 章 : 所 有 第 1 章 : 所 有 第 1 章 : 1-3, 6-8 
1523€. 1-3, 4^ 第 2 35. 1-3, 4* $82; 1-3, 4* 4235. 1-4 
5833.13, 4* 5536: 1-6, .7* 5. 14, 5-72 第 3 章 : 1 -4 
aL 758 3*..1-7, 8^" 第 8 €. 1-7, 8" : Wake. 1-5, 6* 7 
1553; 1-6, 7" ^89 2$; 1-5, 6* $29 Be. 'D-4, 5-6* 5853: 1-6, 7° 
第 6 章 : 1-5, 6* 第 10 章 : 1 55113€; 174, 5" 7H 1-3, 4-5* 
5573€: 1-5 第 11 章 : 所 有 5514 3$. 1-4, 5-7" 5818 3t; 所 有 

第 8 章 : 1-7, 8" 第 12 章 : 所 有 第 15 章 : 所 有 第 19 章 : 所 有 

第 9 童 : 1-5, 6" 第 13 章 : 所 有 第 16 章 : 1-6, 7* 第 20 章 : 所 有 


第 10 章 : 所 有 第 17 章 : 所 有 


Vil 


形式 语言 和 自动 机 理论 的 经 典 表述 考察 了 文法 和 乔 姆 斯 基体 系 中 抽象 机 之 间 的 关系 。 本 书 同 时 也 
描述 了 确定 型 有 限 自动 机 、 下 推 自 动机 、 线 性 无 界 自动 机 和 图 灵机 的 可 计算 性 性 质 。 抽 象 机 的 计算 能 
力 的 分 析 ， 是 通过 使 用 图 灵机 和 无 限制 文法 产生 的 语言 ， 来 识别 语言 的 等 价 性 而 建立 的 。 

可 计算 性 理论 考察 了 算法 问题 解决 的 能 力 和 局 限 。 可 计算 性 包括 确定 性 和 丘吉尔 一 图 灵 理 论 。 其 
中 ， 后 者 通过 建立 图 灵 可 计算 性 和 上 -递归 函数 的 等 价 性 而 获得 支持 。 对 角 化 证 明 用 来 证 明 图 灵机 的 
停机 问题 是 无 解 的 ， 而 问题 化 简 则 用 来 构造 有 关 算法 计算 的 一 系列 问题 的 不 确定 性 。 

对 于 计算 复杂 性 的 研究 ,我们 首先 考虑 计算 所 需要 的 资源 的 度量 方法 。 我 们 选取 图 灵机 作为 评估 
复杂 性 的 框架 ， 时 间 和 空间 的 复杂 性 是 通过 图 灵机 计算 中 使 用 的 转换 数量 和 内 存 数量 来 计算 的 。 了 类 
问题 可 以 使 用 确定 型 图 灵机 在 多 项 式 时 间 内 解决 ， 这 类 问题 被 认为 是 具有 有 效 算 法 解决 方案 的 一 类 问 
题 。 在 这 之 后 ，N 了 类 问题 和 NP 完全 理论 也 会 给 与 介绍 。 逼 近 算 法 用 来 获得 NP 完全 优化 问题 的 近似 
最 优 解 。 

形式 化 语言 理论 在 计算 科学 中 最 重要 的 应 用 是 使 用 文法 来 指定 编程 语言 的 语法 。 这 门 课程 强调 使 
用 形式 化 技术 来 定义 编程 语言 和 提出 有 效 的 分 解 策略 ， 它 起 始 于 用 来 生成 语言 的 上 下 文 无 关 文 法 和 用 
于 识别 模式 的 有 限 自 动机 的 介绍 。 介 绍 语言 的 定义 之 后 ， 第 18 章 至 第 20 章 考 察 了 LL 和 LR 文法 以 及 
通过 这 些 类 型 的 文法 定义 的 语言 的 确定 性 分 解 的 性 质 。 


练习 


掌握 计算 科学 的 理论 基础 的 过 程 不 是 一 场 只 需 旁 观 的 体育 运动 会 。 一 个 人 只 有 通过 解决 问题 ， 并 
考察 主要 结论 的 证 明 ， 才 能 够 充分 理解 理论 的 概念 、 算 法 和 精妙 之 处 的 。 也 就 是 说 ， 对 整体 理解 需要 
更 多 的 细微 努力 。 为 了 达到 这 一 目的 ,我 们 在 每 章 后 面 都 编写 了 一 些 练习 。 这 些 练习 包括 很 多 方面 ， 
既 有 本 章 介绍 的 主题 的 构造 练习 ， 也 有 对 理论 的 扩展 。 

每 部 分 的 练习 中 都 有 几 个 是 带 星 号 的 ， 这 些 问 题 要 比 本 章 的 其 他 问题 更 难 ， 在 本 质 上 更 理论 些 ， 
或 者 更 特别 和 有 趣 。 
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计算 科学 理论 是 有 效 性 计算 的 能 力 和 缺陷 的 数学 检查 。 与 其 他 形式 化 分 析 类 似 ， 这 种 表示 必须 能 
够 提供 概念 、 结 构 和 操作 的 精确 且 无 二 义 性 的 定义 。 下 面 的 表示 法 将 贯穿 本 书 。 


条 H Ho x 50 T 
元 素 和 字符 串 字符 是 字母 表 中 的 小 写 斜体 字母 a, b, abc 

函数 小 写 斜 体 字母 f, 85.5 
集合 和 关系 大 写字 母 和 
文法 大 写字 母 G, G, G, 
文法 的 变量 大 写 斜 体 字母 Ay B, S 
抽象 机 大 写字 母 M, Mı, M 


使 用 罗马 字母 表示 集合 和 数学 结构 在 一 定 程度 上 不 太 标准 ， 然 而 这 样 做 能 使 得 一 种 结构 的 构成 成 
分 很 容易 地 被 识别 出 来 。 例 如 ， 上 下 文 无 关 文 法 的 结构 是 G =( 荆 ,V,P,S$) 。 仅 仅 从 字体 上 我 们 就 可 
以 看 出 ，G 包含 三 个 集合 和 变量 So 

整 本 书 使 用 三 种 计数 系统 ， 每 章 、 节 、 条 目 都 给 出 一 条 引用 。 一 个 计数 序列 记录 了 定义 、 引 理 、 
定理 、 推 论 和 算法 ; 另 一 个 序列 用 来 识别 例子 ; 图 、 表 以 及 练习 使 用 章节 序号 来 标识 。 

证 明 的 结尾 以 国标 记 结束 ,例子 的 结尾 以 口 标记 结束 。 符 号 索引 ， 包 括 这 些 符 号 的 介绍 ， 以 及 它 
们 出 现 的 页 数 ”都 在 附录 工 中 给 出 。 





日 ” 指 英 文 原 书 的 页 码 ， 而 非 本 书页 码 。 一 一 编辑 注 


补充 

我 们 给 出 的 部 分 练习 的 解答 ， 仅 仅 是 为 了 辅助 教师 授课 ? 。 
声明 l 
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日 ”需要 练习 解答 的 教师 请 按 书后 的 教师 服务 沟通 表 中 列 出 的 联系 方式 联系 培 生 教育 出 版 集团 北京 代表 处 。 
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计算 机 科学 理论 起 源 于 那些 有 助 于 促进 科学 进步 的 问题 : how 和 what。 回 符 了 这 两 个 问题 之 后 ， 
接着 是 促进 许多 经 济 决策 的 问题 : how much, 这 本 书 的 目的 就 是 解释 这 些 问 题 对 于 学 习 计算 机 科学 的 
重要 性 ， 并 尽 可 能 地 提供 答案 。 

形式 语言 理论 最 初 是 由 “语言 是 如 何 定 义 的 ”这 个 问题 引出 的 。 在 尝试 捕捉 自然 语言 的 结构 和 各 
种 自然 语言 之 间 的 细微 区 别 的 过 程 中 ,语言 学 家 Noam Chomsky 提出 了 一 个 称 为 文法 的 形式 化 系统 ， 
它 用 来 定义 和 产生 文法 正确 的 句子 。 大 约 在 同时 ,计算 机 科学 家 正在 定义 编程 语言 的 确定 性 和 无 二 义 
性 的 问题 。 于 是 ， 这 两 方面 的 研究 相互 交汇 就 产生 了 编程 语言 ALGOL 的 文法 ， 这 种 语言 使 用 的 是 一 
种 等 价 于 上 下 文 无 关 文 法 的 形式 定义 。 

对 可 计算 性 这 一 领域 的 探索 源 于 两 个 基本 问题 :“ 什 么 是 算法 ?” 和 “算法 计算 的 能 力 和 局 限 性 是 
什么 ?”。 第 一 个 问题 的 回答 需要 计算 的 形式 化 模型 。 计算机 和 高 级 编程 语言 的 结合 ， 可 以 清晰 地 构成 
一 个 计算 系统 ， 这 似乎 能 为 可 计算 性 的 研究 提供 理想 的 框架 。 但 是 我 们 还 需要 考虑 到 是 方法 的 困难 程 
度 。 使 用 什么 样 的 计算 机 ? 它 应 该 有 多 大 的 存储 器 ? 使 用 什么 样 编程 语言 ? 另外 ， 选 择 一 种 特殊 的 计 
算 机 或 语言 可 能 会 对 第 二 个 问题 的 回答 带 来 意外 的 、 不 希望 的 影响 。 在 一 台 已 配置 好 的 计算 机 上 能 够 
解决 的 问题 ， 并 不 一 定 也 能 够 在 另 一 台 计 算 机 上 解决 。 

一 个 问题 是 否 是 算法 可 解 的 ， 有 一 个 算法 解 或 者 没有 , 应 该 独立 于 使 用 的 计算 模型 。 因 此 ;我 
们 需要 一 个 能 够 进行 所 有 可 能 的 算法 计算 的 系统 来 恰当 地 描述 可 计算 性 问题 。 通 用 算法 计算 的 特点 
自 二 十 世纪 三 十 年 代 以 来 就 成 为 了 数学 家 和 逻辑 学 家 研究 的 一 个 主要 领域 了 。 其 间 ， 大 家 提出 了 很 
多 不 同 的 系统 作为 计算 模型 ， 包括 递归 函数 、Alonzo 的 lambda 演算 Markov 系统 和 Alan Turing 设 
计 的 抽象 机 。 所 有 这 些 系统 ， 以 及 其 他 以 此 为 目的 设计 的 系统 ， 都 能 解决 同样 的 问题 集 。 在 第 11 章 
中 ， 我 们 给 出 了 丘 奇 一 图 灵机 的 一 种 解释 ， 即 : 一 个 问题 有 算法 解 当 且 仅 当 它 可 以 被 任何 上 述 系统 
解决 。 

正 因为 它 简单 ， 而 且 其 构成 成 分 与 当今 的 计算 机 相似 ， 所 以 我 们 使 用 图 灵机 作为 研究 计算 机 的 杠 
架 。 图 灵机 与 计算 机 有 很 多 相似 之 处 : 它 接收 输入 、 写 人 内 存 并 产生 输出 。 虽 然 与 计算 机 相 比 ， 图 灵 
机 的 指令 还 很 基本 ， 但 是 ， 如 果 适 当 定 义 图 灵机 的 指令 序列 ， 它 就 可 以 模拟 计算 机 。 尽 管 如 此 ， 图 灵 
机 类 型 还 是 避免 了 传统 计算 机 的 物理 限制 ， 即 : 不 存在 计算 的 时 间 和 内 存 数量 的 上 限 。 因 此 ， 任 何 计 
算 机 解决 的 问题 都 可 以 用 图 灵机 解决 ， 但 反之 则 不 然 。 

接受 图 灵机 作为 有 限 计算 的 统一 模型 之 后 ， 我 们 开始 强调 “什么 是 算法 计算 的 能 力 和 局 限 性 ?” 
丘 奇 一 图 灵机 理论 保证 一 个 问题 是 可 解决 的 ， 当 且 仅 当 能 够 设计 一 个 合适 的 图 灵机 来 解决 它 。 于 是 ， 
证 明 一 个 问题 无 解 便 简化 成 ， 无 法 设计 一 个 图 灵机 来 解决 这 个 问题 。 第 12 章 使 用 这 种 方法 来 证 明 几 
个 有 关 我 们 预测 计算 结果 的 能 力 的 重要 问题 是 无 解 的 。 

一 旦 某 个 问题 确认 是 可 解 的 ， 那 么 人 们 就 开始 考虑 解决 这 个 问题 时 的 效率 和 优化 了 。How much 
这 个 问题 初始 化 了 计算 复杂 性 的 研究 。 图 灵机 再 次 提供 了 一 个 无 偏颇 的 平台 ， 用 来 比较 不 同 问题 的 资 
源 需 求 。 图 灵机 的 时 间 复 杂 性 度量 了 计算 需要 的 指令 数 。 时 间 复 杂 性 把 可 解决 问题 划分 成 两 类 : 易 处 
理 的 和 难处 理 的 。 如 果 一 个 问题 可 以 被 图 灵机 解决 ， 并且 计算 的 执行 指令 数 是 输入 的 多 项 式 函数 ， 那 
么 这 个 问题 就 被 认为 是 易 处 理 的 ;而 不 能 在 多 项 式 时 间 内 解决 的 问题 被 认为 是 难处 理 的 ， 因 为 即使 去 
解决 这 个 问题 的 简单 实例 也 需要 大 量 的 计算 资源 。 
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图 灵机 不 但 是 我 们 考虑 的 惟一 抽象 机 ， 而 且 它 还 是 能 力 逐 渐 增 强 的 一 系列 机 器 中 的 最 顶尖 的 一 
个 。 有 效 计算 的 分 析 源 于 确定 型 有 限 自动 机 的 性 质 研究 。 确 定型 有 限 自 动机 每 读 入 一 次 ， 就 要 根据 机 
器 的 状态 和 输入 待 处 理 的 字符 决定 执行 哪 一 条 指令 。 尽 管 确定 型 有 限 自动 机 的 状态 很 简单 ， 但 是 它 在 
很 多 方面 都 有 应 用 ， 包 括 模式 识别 、 开 关 电 路 设计 和 编程 语言 的 词法 分 析 。 

另 一 种 功能 更 强大 的 机 器 族 ， 称 为 下 推 自动 机 ， 通 过 给 有 限 自动 机 增加 外 部 栈 的 存储 来 实现 。 下 
推 自动 机 中 增加 的 栈 扩 展 了 有 限 自动 机 的 计算 能 力 。 由 于 图 灵机 的 存在 ， 我 们 对 于 可 计算 性 的 研究 将 
会 体现 两 种 语言 族 的 计算 能 力 的 特色 。 

语言 定义 和 可 计算 性 是 这 本 书 的 两 个 主题 。 它 们 并 非 是 计算 机 科学 理论 广阔 领域 中 不 相关 的 两 
个 课题 。 相 反 ， 它 们 不 可 避免 地 纠缠 在 了 一 起 。 机 器 的 可 计算 性 可 以 用 来 识别 语言 ， 如 果 一 个 字符 
串 在 计算 过 程 中 被 证 明 是 语法 正确 的 ， 那 么 这 个 字符 串 就 可 以 被 相应 的 机 器 接收 。 因 此 ， 每 台 机 器 
都 有 相应 的 语言 ， 这 种 语言 是 由 被 这 人 台 机 器 接收 的 字符 串 构成 的 集合 。 每 一 族 抽象 机 的 计算 能 力 都 
被 这 族 机 器 接收 的 语言 来 标识 。 记 住 了 这 一 点 ， 我 们 就 可 以 深入 地 探讨 语言 的 定义 和 有 效 计 算 的 相 
关 话 题 了 。 
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第 一 部 分 
Eo 


理论 计算 科学 包括 语言 定义 、 模 式 识别 、 算 法 计算 的 能 力 和 局 限 性 、 问 题 的 复杂 性 分 析 以 及 它们 
的 求解 研究 。 这 些 问 题 都 是 以 集合 论 和 离散 数学 为 基础 的 。 第 二 章 复习 形式 语言 理论 和 计算 理论 中 需 
要 的 数学 概念 、 操 作 和 表示 符号 。 

形式 语言 理论 源 于 语言 学 、 数 理 逻 辑 和 计算 机 科学 。 第 2 章 我 们 将 给 出 语言 的 集合 论 定 义 。 这 个 
定义 很 充分 ， 因 此 这 个 定义 涵盖 了 自然 〈 口 头 和 书面 ) 语言 和 形式 语言 ， 但 是 这 种 通用 性 是 以 牺牲 提 
供 生成 语言 字符 串 的 有 效 方法 为 代价 的 。 为 了 克服 这 个 缺点 ， 递 归 定 义 和 集合 操作 用 来 给 出 语言 的 有 
限 规约 说 明 。 接 着 ,我 们 介绍 正则 集合 ， 这 是 出 现在 自动 机 理论 、 形 式 语言 理论 、 开 关 电 路 和 神经 网 
络 中 的 语言 族 。 在 第 2 章 的 结尾 还 给 出 一 个 使 用 正则 表达 式 的 实例 一 一 正则 集合 的 简化 表示 一 一 用 来 
描述 文本 搜索 的 模式 。 6 
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集合 论 和 离散 数学 为 形式 语言 理论 、 可 计算 性 理论 和 计算 复杂 性 分 析 提供 了 数学 基础 。 我 们 首先 
回顾 集合 论 的 表示 和 基本 操作 。 集 合 的 基数 度量 集合 的 大 小 ， 并 提供 无 穷 集 合 大 小 的 准确 定义 ; 德国 
数学 家 George Cantor 深入 研究 集合 的 属性 后 得 出 一 条 有 趣 的 结论 ， 就 是 存在 不 同 大 小 的 无 穷 集 。 尽 管 
Cantor 的 工作 仅仅 表明 存在 一 个 完整 的 无 穷 集合 规模 层次 ， 但 是 这 已 经 足够 支持 我 们 把 无 穷 集合 分 成 
两 类 的 目的 了 。 这 两 类 分 别 是 可 数 的 和 不 可 数 的 。 如 果 集合 的 元 素数 目 与 自然 数 一 样 多 ， 那 么 这 个 集 
合 是 可 数 的 无 穷 集 。 如 果 元 素数 目 比 自然 数 多 ， 就 是 不 可 数 无 穷 集 ， 

在 本 章 中 ,我 们 将 使 用 对 角 化 论证 (diagonalization argument) 结构 来 证 明定 义 在 自然 数 集合 上 的 
函数 集合 是 不 可 数 无 穷 集 。 我 们 在 有 效 过 程 (effective procedure) 和 可 计算 函数 (computable func- 
tion) 的 意义 上 达成 共识 后 (这 也 是 本 书 第 三 部 分 的 主要 目的 ) ， 将 能 够 确定 可 以 用 算法 计算 的 函数 集 
合 的 大 小 。 通 过 比较 这 两 个 集合 的 大 小 ; ;就 可 以 证 明 存在 这 样 的 函数 ， 它 们 的 值 不 能 使 用 任何 算法 过 
程 计 算得 到 。 

一 个 集合 可 能 由 任意 一 组 对 象 组 成 ， 我 们 对 那些 机 械 化 生成 元 素 的 集合 感 兴趣 。 然 后 ; 我 们 介绍 
可 以 产生 集合 元 素 的 递归 定义 ; 接着 构造 递归 生成 的 集合 与 数学 归纳 法 之 间 的 关系 。 归 纳 已 经 被 证 明 
能 够 为 递归 产生 的 无 穷 集合 中 的 元 素性 质 提供 一 个 通用 的 证 明 技巧 。 

在 本 章 的 最 后 ， 我 们 将 复习 有 向 图 和 树 等 知识 ， 这 是 贯穿 本 书 的 两 种 结构 ， 并 以 图 形 方式 的 解释 
了 形式 语言 理论 和 计算 理论 的 概念 。 


1.1 集合 论 


我 们 假设 读者 熟悉 初等 集合 论 的 表示 。 在 这 节 中 ， 我 们 主要 回顾 这 个 理论 的 概念 和 记号 。 符 号 e 
表示 成 员 资格 ; xe X 表示 x 是 集合 X 的 成 员 或 元 素 。 带 斜 线 的 符号 表示 否 ，xeX 即 表 示 x 不 是 X 的 
一 个 成 员 。 如 果 两 个 集合 包含 相同 的 成 员 ， 那 么 这 两 个 集合 相等 。 在 本 书 当 中 ,我们 使 用 大 写字 母 表 
示 集 合 。 特 别 地 ，X，Y LZ 用 来 表示 任意 集合 。 集 合 的 元 素 用 斜体 表示 。 例 如 ,a, b, A, B, aaaa 
和 abc 的 字符 和 字符 串 形式 表示 集合 的 元 素 。 

括号 | | 用 来 给 出 集合 的 定义 。 集 合 中 成 员 个 数 很 少 的 时 候 ， 可 以 直接 给 出 集合 的 定义 ， 也 就 是 把 
集合 的 元 素 列 出 来 。 集 合 

X211,2,31 
Leta De da 
就 是 使 用 显 式 的 方式 定义 的 。 如 果 集 合 有 大 量 有 限 个 元 素 ， 或 无 穷 数 目的 元 素 时 ， 就 必须 使 用 隐 含 方 
式 给 出 定义 。 集 合 的 隐 式 定义 是 通过 描述 集合 中 元 素 的 指定 条 件 给 出 的 。 例 如 ， 包 含 所 有 的 完全 平方 
的 集合 定义 为 
{n| nz m^, m 为 任意 自然 数 | ， 
隐 式 定义 中 竖 线 | 读 作 “满足 ”"。 整 个 定义 读 作 “n 的 集合 ,满足 n 是 某 个 自然 数 m 的 平方 。” 

上 面 的 例子 中 提 及 了 自然 数 集合 (natural numbers) 。 这 个 重要 的 集合 ， 用 N a, HO, 1, 2, 
3，…。 SH (empty set) 用 表示 ， 这 个 集合 里 没有 成 员 ， 也 可 以 显 式 定义 为 B=| jo 

集合 由 它 的 全 体 成 员 完 全 确定 。 定 义 中 元 素 的 表示 顺序 并 不 重要 。 显 式 定义 

Kale Ost, Y 12,1:3 1 2:11,3.2-2:2] 
表示 同一 个 集合 。Z 的 定义 中 包含 数字 2 的 多 个 实例 。 集 合 中 的 重复 定义 并 不 影响 其 成 员 资格 。 集 
合 相 等 要 求 集合 具有 相同 的 成 员 ， 如 上 面 这 个 例子 ,集合 X, YY 和 Z 都 有 自然 数 1，2 和 3 作为 
成 员 。 
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WR Y 的 每 个 成 员 都 是 X 的 成 员 ， 集 合 Y 是 集合 X 的 子 集 ， 记 作 YCX。 空 集 是 任何 集合 的 子 
集 。 每 个 集合 X 都 是 它 自身 的 子 集 。 如 果 Y 丫 是 XX 的 子 集 ， 并且 Y#X, 那么 Y 是 X 的 真子 集 。X 的 
所 有 子 集 的 集合 ， 称 作 X WER, WE P(X). 
例 1.1.1 已 知 X=|1,2,3} ,X 的 子 集 包括 
Ø 11} {2} 13] 
(1,217 712,3] 13,1] 14523}; 口 
集合 操作 使 用 已 知 的 集合 来 创造 新 集合 。 两 个 集合 的 并 (union) 定义 为 
XUY ={z| zeX X ze Y}. 
或 者 是 指 相 容 ， 表 示 如 果 z 是 X 的 成 员 , 或 者 是 Y 的 成 员 , 或 者 是 两 者 的 成 员 , 那么 z 是 XUY 的 成 
员 。 两 个 集合 的 交 (intersection) 是 包含 两 个 集合 共同 成 员 的 集合 ， 其 定义 为 
XNY={z| zeX 并 有 zeY}. 
交集 为 空 的 两 个 集合 称 为 不 相交 (disjoint), n 个 集合 和 ,X,,…,X, 的 并 集 和 交集 分 别 定义 为 


U X; -X;UX;U--UX, = {x| xe X HP i81,2-,n| 
izl 


N Xi -XinX;n--nX,z |x| xex,, Km i=1,2…,n|， 
i=l 


AUR 
) x= UJ) 


i) X NX, =O, Kp 1«i,j&n Jt B'izj, 
那么 集合 X 的 子 集 X, ,X, ,…,X, 称 为 是 X 的 划分 (partition) 。 例 如 ， 偶 数 自然 数 的 集合 (0 被 认为 是 
偶数 ) 和 奇数 自然 数 的 集合 是 自然 数 N 的 划分 。 

集合 X 和 集合 Y 的 差 (difference) X-Y, 包含 属于 XX 但 不 属于 YY 的 元 素 : 

X-Y={z|zeX 并 HB zeYl. 

设 X 是 全 集 U 的 子 集 。X 对 于 可 的 补 集 (complement) 是 包含 属于 器 但 不 属于 X 的 元 素 的 集合 。 换 
句 话 说 ,，X 对 的 补 集 是 U -X。 已 知 全 集 U, XIIF U 的 补 集 记 作 X。 下 面 的 恒等式 叫做 德 摩根 定 
4£ (DeMorgan's Laws) , Js X 和 是 集合 UMTS, Jf EX U 取 补 时 的 并 、 交 和 补 关 系 。 

i) (XUY) -XnY 

ii) (XNY) -XUY. 

例 1.1.2 EM X={0,1,2,3}, Y 212,3,4,5] , X MY Bde XA Y MF U 的 补 集 。 那 么 

XUY={0,1,2,3,4,5} X= {n|n>3} 








XNY = {2,3} Y={0,1} U{n| n»5] 
X-Y={0,1} XNY={n| n>5} 
Y-X-14,5| (XUY) = in| n>5| 
右边 一 列 的 最 后 两 个 集合 显示 了 德 摩根 定律 中 的 等 式 。 E 


FRAME VHT WEB] X E Y 的 子 集 的 方法 : 我 们 必须 证 明 X 的 每 一 个 元 素 也 是 Y 的 元 素 。 当 
X 是 有 限 集 时 ， 我 们 可 以 直接 检查 X 中 的 每 个 元 素 ， 看 它 是 否 是 Y 的 元 素 。 AX ES SUR 
时 ， 则 需要 使 用 别 的 方法 来 解决 。 解 决 的 策略 就 是 证 明 X 中 的 任意 元 素 都 属于 Y。 
例 1.1.3 RTÆWEH X= 18n-1| n>O} BY 2 12m «1| m 是 奇数 | 的 子 集 。 为 了 更 好 地 理解 集 
合 X 和 站， 我 们 可 以 列 出 和 和 的 元 素 。 
X: 8-1-1=7, 8-2-1=15, 8- 3=t=23, 8: 4-4t=3b, 
YS 3 43 75, 2.55941 & ih, 2 + 7 410.218; ) 
为 了 建立 这 种 相 容 关系 ， 我 们 必须 证 明 X 的 每 个 元 素 也 是 Y 的 元 素 。X 中 的 任意 元 素 x 都 有 8n - 119 
ÉR, 其 中 , n >0。 iE m-4n-1, 那么 m 是 奇数 ， 并且 l 
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2m+1 -2(4n-1) +1 
=8n-2+1 
=8n-1 
=X. 
因此 , x 也 属于 Y, 并 且 XCY。 口 
集合 相等 可 以 通过 集合 相 容 来 定义 。 如 果 XGSEY 并 且 YOK, 那么 集合 X 和 立 相 等。 这样 就 简单 
地 证 明了 X 的 每 个 元 素 都 是 Y 的 元 素 ， 反 之 亦 然 。 当 构造 两 个 集合 相等 关系 时 ,通常 分 别 证 明 这 两 
个 相 容 关系 ， 然 后 再 将 它们 结合 起 来 ， 众 而 证 明 集合 的 相等 。 
例 1.1.4 证 明 集 合 
X= {n| n2 m^ 任意 自然 数 m>0| 
Y= {n? +2n+1|n>0} 
相等 。 首 先 ， 我 们 要 证 明 X 的 每 个 元 素 都 是 立 的 元 素 。 设 xeX， 则 存在 某 个 自然 数 产 >0 (4G x =m’, 
设 mo 就 是 这 个 数 ， 则 x 可 以 写成 
x 5m) 
z(m,-1-41) 
z(m,-1)'*2(m,-1) +1 
Bn=m,-1, BART RA WBA x 2m +2n+1, He nz0, Alt, x 是 集合 Y 的 元 素 。 
然后 ,我 们 构造 另 一 个 相 容 关系 。 设 y=n6 +2m +1 Æ Y 的 元 素 ， 因 式 分 解 得 到 y= (no +1)’. 


因此 ，y 是 某 个 自然 数 的 平方 且 大 于 0， 因 此 它 也 是 X 的 元 素 。 因 为 XCY 并 且 Y CX, 所 以 X=Y。 


li] 
1.2 笛 卡 儿 积 、 关 系 和 函数 


笛 卡 儿 积 (cartesian product) 是 建立 两 个 已 知 集合 的 元 素 的 有 序 对 的 集合 的 操作 。 集 合 X 和 立 的 

笛 卡 儿 积 ， 表 示 成 XXXY， 可 以 定义 为 
XxYzl[x,yllxeX3Jt B. y eY]. 

X 和 立 的 二 元 关系 (binary relation) J£ X xY 的 子 集 。 自 然 数 的 排序 可 以 用 来 产生 基于 集合 N x 

NN 的 关系 LT ( 少 于 )。 这 个 关系 是 NNxNN 的 子 集 ， 定 义 为 
LT={[i,j] | i<j 并 有 i,jeN|. 

符号 [i,j] eLT 表示 i 小 于 j。 例如 , [0,1],[0,2] eLT3ERH[1,1] LT, 

笛 卡 儿 积 可 以 进一步 被 泛 化 ， 从 而 能 让 我 们 使 用 有 限 数目 的 集合 来 构造 新 的 集合 。 如 果 x, 
x ,是 nn 个 元 素 ， 那么 [x ,加 ,…,,] 就 称 为 有 序 的 n 项 (ordered n-tuple)。 一 个 有 序 对 是 有 序 的 2 
项 的 另 一 个 名 字 。 有 序 的 3 项 、4 项 和 5 项 分 别 指 的 是 三 元 组 、 四 元 组 和 五 元 组 。7 个 集合 X) ,X, ,…， 
X, 的 笛 卡 儿 积 定义 为 

X, xX, x: xX, =] [xx x] xe X, i=1,2,---,n}. 

X, ,Xi ，,…,X, 上 的 n TARE X, x X, x… xX, 的 子 集 。1 元 、2 元 和 3 元 关系 分 别称 为 一 元 的 、 二 元 
的 和 三 元 的 。 

例 1.2.1 E&41X-11,2,3], Y= tabh MA 

a) XxY 21|[1,a];[1,5],[2,a],[2, 5], 3,2], [3,5] 

b) YxX={[a,1],[a,2],[a,3],[b,1],[6,2],[b,3]} 

c) YxYs1[a,al,| a,b], bal Lb bd 

d) XxYxY-1[1,2,a4 ,[1;5,a] ,[2,25a], [Z, 5,2] 1[35a,a], [3,P,a] , 
^ [1,a,b],[1,b,b],[2,a,b],[2,b,b],[3;a,b],[3,b,b]} LJ 
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非 形式 化 地 说 ， 从 集合 和 到 集合 立 的 函数 (function) 就 是 从 XX HERE Y 的 元 素 的 映射 ， 并 且 
X 中 的 每 个 元 素 最 多 映射 到 YY 中 的 一 个 元 素 。 从 和 到 Y 的 函数 可 以 表示 成 f: XY. Y 的 元 素 通 过 
函数 赋值 给 元 素 xeX 来 获得 ,， 记 作 f(x)。 集 合 X 为 函数 的 定义 域 (domain), X 的 元 素 是 函数 的 
操作 数 。f 的 值 域 (range) 是 通过 赋值 给 X 而 获得 的 Y TH. Alt, MAS: XY 的 值 域 是 集合 
{ye Y| y=f(x) TIER xeXI, 

给 每 个 人 赋 以 年 龄 的 关系 就 是 从 人 到 自然 数 的 函数 。 注 意 ， 值 域 中 的 每 个 元 素 可 能 会 被 赋 给 定义 
域 中 多 个 元 素 一 一 因为 有 很 多 人 的 年 龄 相同 。 而 且 ， 并 不 是 所 有 的 自然 数 都 是 函数 的 值 域 ， 自 然 数 
1000 就 不 可 能 赋 给 任何 人 。 

函数 的 定义 域 是 集合 ， 但 是 这 个 集合 经 常 是 两 个 或 多 个 集合 的 笛 卡 儿 积 。 函 数 

f: X, XX, x- xX, Y 
就 是 n 个 变量 的 函数 (n-variable function) 或 操作 。 变 量 x, x, ,x 的 函数 值 表示 成 f(x XXn) 0 
具有 一 个 变量 、 两 个 变量 或 者 三 个 变量 的 函数 经 常用 来 指 一 元 操作 、 二 元 操作 和 三 元 操作 。 函 数 
sq: NN， 把 ww 赋 给 每 个 自然 数 ， 这 就 是 一 元 操作 。 当 函数 的 定义 域 包含 集合 X 和 它 自 身 的 笛 卡 儿 
积 的 时 候 ， 这 个 函数 就 称 为 是 X 上 的 一 元 操作 。 加 法 和 乘法 就 是 N 上 的 三 元 操作 。 

函数 j 为 定义 域 的 成 员 和 了 值 域 的 成 员 建 立 了 关联 。 函 数 的 本 质 定义 就 是 依赖 于 这 种 关系 的 。 从 
X F) Y HERH (total function) f 就 是 基于 XxYY 的 二 元 关系 的 ， 并 且 要 求 它 满足 下 面 两 个 性 质 ; 

i) 对 于 每 个 xeX， 都 存在 ye Y 使 得 [x,y] efi 

ii) 如 果 [x,y,] ef, 并 上 且 [x,y,] ef, IA yi =y 

第 一 个 性 质保 证 X 中 的 每 个 元 素 都 被 赋 给 Y 中 的 一 个 成 员 ， 因 此 才 有 全 这 个 术语 。 第 二 个 性 质 
保证 这 个 赋值 是 惟一 的 。 前 面 定义 的 LT 关系 不 是 全 函数 ， 因 为 它 不 满足 第 二 个 条 件 。N x N 上 表示 
大 于 的 关系 不 能 满足 上 述 的 任何 一 个 性 质 ， 这 是 为 什么 呢 ? 

例 1.2.2 已 知 X=11,2,31 和 YY= la,bl , MX SI Y BST A RS FR ZR o 


x f(x) x f(x) x f(x) x f(x) 











1 a 1 a 1 a 1 b 

2 a 2 a 2 b 2 a 

3 a 3 b 3 a 3 a 

x | f(x) x | f(x) x | f(x) x | f(x) 

1 a 1 b 1 b 1 | b 

2 b 2 a 2 b 2 b 

3 b+} 3 b 3 a 8 b oO 


从 和 到 Y 的 部 分 函数 (partial function) fÆ X xY 上 的 关系 ， 并 且 在 这 个 关系 中 ， 如 果 [x,y, ] ef 
Hix, y] ef, A y =y WREE ye Y 使 得 [x,y] ef, 那么 就 是 关于 x 的 部 分 函数 。 否 则 , fw 
没有 给 出 x 的 定义 。 全 函数 也 是 一 种 部 分 函数 ， 只 不 过 它 为 定义 域 的 所 有 元 素 给 出 了 定义 。 

尽管 我 们 使 用 关系 的 形式 给 出 了 函数 的 定义 , 但 是 我 们 将 使 用 标准 形式 f(x) =y 来 表示 y 的 值 是 
通过 函数 为 x 赋值 而 得 到 的 值 ; 即 [x,y] ef. HS f(x) 1 表示 不 存在 为 参数 x 定义 的 部 分 函数 f， 符 
5 f(x) | 用 来 表示 定义 的 用 x) 并 不 显 式 地 给 出 它 的 值 。 

整数 除法 定义 了 从 N xN 到 NN 的 三 元 部 分 函数 div。 用 i 除 以 j 获 得 结果 就 是 商 ,， 记 为 div(i,j)。 
例如 ，div(3,2) =1，div(4,2) =2, div(1,2) =0。 使 用 前 面 的 表示 ， 对 所 有 的 j (除了 0) 有 div(i,0) f 
和 div(i,j) } o 
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ROR X 的 每 个 元 素 都 映射 到 值 域 中 的 惟一 一 个 元 素 ， 那么 全 函数 f; Xo Y 就 是 一 对 一 的 (one- 
to-one)。 形 式 化 地 ， 如 果 克 了 二 则 及 x) 关 作 x)， 那 么 f 是 一 对 一 的 。 如果 f 的 值 域 是 全 集 Y， 那 
ARRS: XY 就 是 满 射 (onto) 。 全 函数 在 定义 域 和 值 域 之 间 的 映射 关系 既是 一 对 一 的 ， 又 是 满 
射 的 。 

例 1.2.3 函数 fg 和 是 定义 在 N 到 N-=- 10}1 上 的 ， 后 者 是 正 整数 的 集合 。 

i) f(n) =2n+1 

2 AP EAM 

iii) s(n) =n+1 
PAS EAk, (AN ET. FR AES g 定义 的 从 N 到 N - 10] 的 映射 显然 是 满 射 ， 
但 不 是 一 对 一 的 映射 ， 因 为 8(0) =8(1) 21. PRX s 既是 一 对 一 的 映射 ， 又 是 满 射 ， 因 此 它 定义 了 一 
个 自然 数 到 它 的 后 继 之 间 的 映射 。 口 

例 1.2.4 在 前 面 的 例子 中 ， 我 们 注意 到 函数 九 z) =2n +1 是 一 对 一 的 映射 ,但 不 是 映射 到 整个 
集合 N - 10} 上 的 。 尽 管 如 此 ， 从 N 到 奇 自然 数 的 集合 的 映射 既是 一 一 对 一 的 映射， 也 是 满 射 的 。 我 们 
将 使 用 f 来 演示 如 何 证 明 函 数 具 有 这 些 性 质 。 

一 对 一 : 为 了 证 明 函 数 是 一 对 一 的 ， 我 们 要 证 明 当 fn) =f(m) 时 , n Al m 一定 相等 。 假设 f(n) = 
fim), BA 

2n41 -2m41 或 者 
2n -2m, RA, 
n=m. 
RE, nm 意味 着 fn) 关 f(m)， 因 此 f 是 一 对 一 的 。 

ihr: 为 了 构造 把 N 映射 到 整个 奇 自然 数 的 集合 ， 我 们 必须 证 明 每 个 奇 自然 数 都 在 f 的 值 域 中 。 
如 果 m 是 奇 自然 数 ， 那 么 它 就 可 以 写成 m=2n+1， 其 中 neN。 于 是 f(n) =2n+1=m 并 且 m 位 于 f 
的 值 域 中 。 图 


1.3 等 价 关系 


我 们 曾经 用 笛 卡 儿 积 XxX 的 子 集 来 形式 化 地 定义 集合 X 上 的 二 元 关系 。 非 形式 化 地 ， 我 们 使 用 
关系 来 表示 集合 的 两 个 元 素 之 间 是 否 存在 某 种 性 质 。 如 果 有 序 对 的 元 素 满 足 前 面 所 说 的 条 件 ， 那 么 
就 在 这 个 关系 之 中 。 例 如 ， 属 性 少 于 定义 了 自然数 集合 上 的 二 元 关系 。 使 用 这 个 属性 定义 的 关系 是 集 
@ LT={[i,j] | i«jl. 

中 级 表达 式 经 常 被 用 来 表示 常见 二 元 关系 中 的 成 员 资格 。 在 这 种 标准 使 用 当中 ，i<j 意味 着 i 小 
Fj, 并 且 Li, j] 在 上 面 定义 的 关系 LT H, 

我 们 现在 考虑 一 种 称 为 等 价 的 关系 ， 这 种 关系 可 以 用 于 划分 潜在 集合 。 等 价 关系 通常 使 用 中 缀 表 
达 式 a=b 来 表示 a SUF b. 

定义 1.3.1 集合 XX 上 的 二 元 关系 三 是 等 价 关系 ,除非 它 满足 下 面 的 条 件 

i) HRM: 4 三 a， 对 于 所 有 的 aeX。 

ii) 对 称 性 : a=b 意味 着 b 三 a， 对 于 所 有 a, beX, 

ii) 传递 性 : a=b 并 且 b==c， 则 意味 着 4 三 c， 对 于 所 有 a, b, ceX。 

定义 1.3.2 已 知 三 是 卵 上 的 等 价 关 系 。 元 素 ae XX 的 等 价 类 (equivalence class) 使 用 关系 三 定 
义 了 集合 [a] - ={beX| a=d}, 

例 1.3.1 已 知 =。 ÆN EEH n=, m 定义 的 奇偶 关系 ， 当 目 仅 当 n 和 m 具 有 同样 的 奇偶 性 ( 奇 
数 或 偶数 ) 。 为 了 证 明 =。 是 等 价 关系 ， 我们 必须 证 明 它 的 对 称 性 、 自 反 性 和 传递 性 。 

i) 自 反 性 : 对 于 每 个 自然 数 n，n 和 它 本 身 有 相同 的 奇偶 性 ， 并 且 non. 
ii) 对 称 性 : WR n= m， 那么 n 和 m 有 相同 的 奇偶 性 ， 并 且 m=, n 
ii) 传递 性 : WR ne,mJftH m=; k, 那么 n 和 m 有 相同 的 奇偶 性 ， 并 上 且 六 和 大 有 相同 的 奇偶 
性 。 然 后 n Ak AMM AE, FFA n=, ko 
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奇偶 关系 的 两 个 等 价 类 三 , [0] =, = (0,2,4,---| ALL] =, =11,3,5,--} E 

等 价 类 通常 写成 [ea] - ， 其 中 是 这 个 类 中 的 一 个 元 素 。 在 前 面 的 这 个 例子 中 ，[0] -, 用 来 表示 偶 
自然 数 的 集合 。 引 理 1. 3. 3 证 明 如 果 amb, W[a]. =[2] -。 因 此 ， 选 择 哪 个 元 素来 表示 这 个 类 都 是 
不 重要 的 。 

引 理 1.3.3 已 知 三 是 XX 上 的 等 价 关 系 ， 并 且 a 和 4b 都 是 义 的 元 素 。 那 么 我 们 可 以 得 到 [a]. = 
[b] Ala]. [5]. =O. 

证 明 : 假设 [a] -和 [2] -的 交集 不 空 ， 那 么 存在 元 素 c 属于 两 个 等 价 类 中 。 使 用 对 称 性 和 传递 性 ， 
我 们 可 以 得 到 [5] -GE[a] - 。 因 为 c 既 属 于 [a] -又 属于 [b]. MART AR a=c HA b=c。 
根据 对 称 性 有 c=b。 再 使 用 传递 性 就 能 得 到 a=b, i 

现在 我 们 假设 4 是 [b] -中 的 任意 元 素 , BA b=d, BA a=b 和 4b=4， 并 使 用 传递 性 可 以 得 到 
a=d, 所 以 de[a] -。 因 此 我 们 已 经 证 明了 [2] -中 的 任意 元 素 也 属于 [az] - 。 根 据 类 似 的 证 明 ， 我 们 
可 以 构造 [La] Clb] - 。 依 据 这 两 个 相 容 关系 ， 我 们 就 可 以 得 到 想 要 的 集合 相等 关系 。 m 

E 1.3.4. 设 三 是 义 上 的 等 价 关系 。 三 的 等 价 类 是 义 的 划分 。 

WEBB. 根据 引 理 1.3.3， 我们 知道 等 价 类 形成 X 的 不 相交 的 子 集 族 。 设 a 是 X 的 任意 元 素 。 根 据 
自 反 性 有 ae [a] .。 因 此 XX 的 每 个 元 素 都 属于 某 个 等 价 类 。 这 些 等 价 类 的 并 集 就 是 整个 集合 X。 M 


1.4 可 数 集合 和 不 可 数 集合 


集合 的 基数 是 对 集合 大 小 的 度量 。 直 观 上 说 ， 集 合 的 基数 就 是 集合 中 元 素 的 数目 。 当 处 理 有 限 集 
合 的 时 候 ， 这 个 非 形式 化 的 定义 就 足够 了 。 我 们 可 以 通过 数 集合 元 素 的 数目 来 获得 集合 的 基数 。 但 当 
把 这 种 方法 扩展 到 无 穷 集合 的 时 候 ， 就 会 出 现 明显 的 困难 。 
通过 建立 一 对 一 的 集合 元 素 映射 ， 我 们 可 以 证 明 两 个 有 限 集合 具有 相同 数目 的 元 素 。 例 如 ， 映 射 
a1 
b—2 
c3 
说 明 集 合 |a,b,c| 和 |1,2,3| 具 有 相同 数目 的 元 素 。 这 种 使 用 映射 的 方法 来 比较 集合 的 大 小 ， 对 于 有 限 
集合 和 无 穷 集合 都 适用 。 
定义 1.4.1 i) 如 果 从 义 到 YY 之 间 存 在 一 个 完全 一 对 一 的 满 射 ， 那么 久 和 YY 这 两 个 集合 具有 相 
同 的 基数 。 
ii) 如 果 从 义 到 YY 之 间 存 在 一 个 完全 的 一 对 一 的 映射 ， 那 么 集合 义 的 基数 不 大 于 集合 Y。 
注意 这 两 个 定义 惟一 的 差别 就 是 映射 覆盖 集合 立 的 程度 。 如 果 一 对 一 的 映射 履 盖 的 区 域 是 整个 Y， 那 
么 这 两 个 集合 具有 相同 的 基数 。 
集合 X 的 基数 表示 成 card(X)。(i) 和 (ii) 里 面 的 关系 可 以 分 别 表示 成 card(X) = card ( Y ) 和 
card( X) <card(Y), WẸ card( X) <card(Y) 并 且 card( X) Acard(Y), BAX 的 基数 严格 小 于 YY 
的 ， 写 成 card(X) < card( Y) , Schróder-Bernstein 定理 为 基数 构造 了 大 和 = 之 间 的 类 似 关 系 。Schr6der- 
Bernstein 定理 的 证 明 留 作 练 习 。 
定理 1.4.2 (Schróder-Bernstein ) 如 果 card ( X) & card ( Y ) 并 且 card( X) zx card( Y), AA 
card( X) « card( Y) 。 
有 限 集 合 的 基数 可 以 用 集合 中 元 素 的 数目 表示 。 因 此 ，card( a,b] ) =2。 和 自然 数 集合 的 基数 相 
同 的 集合 称 为 可 数 无 穷 的 〈countably infinite 或 者 denumerable) 。 直 观 地 ， 如 果 集 合 的 成 员 可 以 按照 某 
种 顺序 数 出 来 ， 那 么 集合 就 是 可 数 的 。 映 射 了 建立 了 它 和 自然 数 之 间 的 对 应 关系 ， 并 提供 了 相应 的 排 
序 : 第 一 个 元 素 是 所 0) ， 第 二 个 是 九 1) ,第 三 个 是 f(2) 等 等 。 术 语 可 数 (countable) 指 的 是 集合 有 限 
或 者 可 以 数 出 来 。 不 可 能 数 出 来 的 集合 称 为 不 可 数 (uncountable) 。 . 
集合 N - {01 是 可 数 无 穷 的 ; 函数 s(n) =n+1 定义 了 从 NN 到 N-101 之 间 的 一 对 一 映射 。 看 起 来 
REALE, BAN -101 是 去 掉 集合 N 中 的 一 个 元 素 获得 的 ， 可 是 它 却 和 集合 N 有 相同 数目 的 元 
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素 。 很 明显 ， 有 限 集 到 它 的 真子 集 之 间 不 存在 一 对 一 的 映射 。 这 也 是 有 限 集 合 和 无 穷 集合 之 间 的 区 别 

特性 。 Jud <9 sy Fm a 
4X 1.4.83 如 果 集合 存在 一 个 与 之 等 基数 的 真子 集 ， 那 么 

这 个 集合 就 是 无 穷 的 (infinite) 。 
例 1.4.1 奇数 集合 是 可 数 无 穷 的 。 例 1.2.4 中 的 函数 0 

f(n) =2n +1 构 造 了 集合 N 和 奇数 之 间 的 一 对 一 的 对 应 关系 。 — D] 
如 果 集 合 的 元 素 可 以 与 自然 数 之 间 建 立 一 对 一 的 映射 关系 ， 


那么 集合 就 是 可 数 无 穷 的 。 从 N 到 集合 之 间 的 满 射 图 揭示 了 集合 4 

的 可 数 性 。 自 然 数 和 所 有 正 整 数 之 间 的 一 对 一 映射 表明 了 正 整 数 3 

集合 也 是 可 数 的 。 这 个 映射 关系 可 以 表示 成 下 面 的 函数 4 
div(n,2) +1 WẸ n ETA 

Kul E re ALAK : 


例 1.4.2 无 穷 二 维 格 上 的 点 可 以 用 来 证 明 N xN， 自 然 数 的 
有 序 对 集合 是 可 以 数 出 来 的 。 这 个 格 是 通过 给 自然 数 的 数 轴 作 标记 来 构造 的 。 "TT. i 和 纵 坐 标 j 表 
示 有 序 对 [i,j]。 
沿 着 图 中 箭头 的 顺序 ， 我 们 列 出 每 个 格 的 元 素 。 这 样 就 可 以 构造 出 下 面 的 这 个 映射 
0 1 2 3 4 5 6 7 
t 1 t 1 t t + t 
[0,.0]..[0, 1]. [1, 0]. [0; 2]. [dy i2, 0b 2Y- fy 2] 
从 而 验证 了 N xN 是 可 以 数 出 来 的 。 上 面 给 出 了 从 有 序 
XL i,j] BAAR G +j) Ci +j +1)/2)/i ZA H— Xt — 


si ce a 4 d [04] [t4] [24] [34] 
语言 理论 和 可 计算 性 中 感 兴趣 的 集合 基本 上 都 毫 无 bs 


可 数 集合 的 几 个 封闭 性 质 ， 但 不 给 出 相应 的 证 明了 。 NS a 
定理 1.4.4 i) 两 个 可 数 集合 的 并 仍然 是 可 数 集合 。 b EU 

i) 两 个 可 数 集合 的 笛 卡 儿 积 仍然 是 可 数 的 。 UU, i 

ii) 可 数 集合 的 有 限 子 集 的 集合 是 可 数 的 。 SENA i 

iv) 一 个 由 非 空 可 数 集合 的 元 素 构成 的 有 限 长 的 序 CENE is 
列 构成 的 集合 ， 是 可 数 无 穷 的 。 gps * 

前 面 的 定理 说 明了 可 数 这 个 性 质 在 很 多 标准 集合 理 hos nop 让 
论 操作 下 是 可 以 保持 的 。 因 为 在 新 产生 的 集合 和 自然 数 VEI i 
的 子 集 之 间 总 可 以 建立 一 对 一 的 映射 ， 因 此 得 到 的 这 些 
集合 的 操作 都 是 封闭 的 。 

如 果 不 能 够 按 某 一 顺序 来 列 出 集合 的 元 素 ， 那 么 这 个 集合 就 是 不 可 数 的 。 下 面 这 个 证 明 方法 称 为 
Cantor 对 角 化 论证 (Cantor's diagonalization argument) ， 用 来 证 明 存在 一 个 从 N 到 NN 的 不 可 数 全 函数 。 
BARRAS: NN Ag: NN 相等 的 条 件 是 0 1 2 3 4 
对 于 定义 域 中 的 每 个 元 素 它 们 都 有 相同 的 值 。 
即 : 如 果 对 于 所 有 的 meN f(n) =g(z)， 则 
fes. 为 了 证 明 两 个 函数 不 同 ， 只 需 找到 一 个 
输入 值 ， 使 得 两 个 函数 值 不 同 即 可 。 

假设 从 自然 数 到 自然 数 的 全 函数 的 集合 是 
可 数 集合 。 那 么 就 存在 一 个 序列 及 ,fi ees 
它 包含 所 有 的 函数 。 这 些 函 数 的 值 可 以 展示 成 


` 


` 


例外 的 是 有 限 的 或 者 是 可 以 数 出 来 的 。 下 面 ， 我 们 给 出 dim pee 
P E 
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二 维 格 结构 ， 其 中 输入 值 是 横 轴 ， 函 数值 是 纵 轴 。 

考虑 使 用 f(n) 2f, (n) +1 定义 的 函数 1: NON, 的 值 通过 给 格 的 对 角 线 增加 1 来 获得 ， 因 此 ， 
我 们 将 其 命名 为 对 角 化 。 通 过 给 每 个 i 定居 f，f( 记 关 f(i)。 因 此 , 了 不 在 序列 中 。 然 而 已 知 序列 广 , fi, 
户 ，… 包 含 所 有 的 全 函数 ， 所 以 矛盾 。 因 为 假设 函数 的 数目 是 可 数 无 穷 的 ， 从 而 导致 了 这 个 矛盾 ， 所 
以 集合 是 不 可 数 的 。 

对 角 化 是 一 种 通用 的 证 明 技 巧 ， 用 来 证 明 集合 不 是 可 数 的 。 正 如 前 面 的 例子 所 示 ， 使 用 对 角 化 构 
造 不 可 数 就 是 反 证 法 的 一 个 证 明 依 据 。 第 一 步 假 设 集合 是 可 数 的 ， 因 此 它 的 元 素 可 以 穷 举 地 列 出 来 。 
通过 产生 一 个 不 应 该 出 现在 序列 中 的 元 素 从 而 产生 了 矛盾。 列举 元 素 的 时 候 不 需要 附加 任何 条 件 ， 除 了 
它 必须 包含 在 集合 的 所 有 元 素 。 通 过 对 角 化 产生 的 矛盾 证 明了 不 存在 列举 所 有 元 素 的 可 能 ， 因 此 ， 集 
合 是 不 可 数 的。 下 面 的 例子 将 再 次 展示 了 这 个 技巧 。 

例 1.4.3 如 果 存 在 自然 数 i 使 得 f(i) =i, 那么 从 N 到 NN 的 函数 就 存在 固定 点 (fixed point), 
in, n) =n2 有 固定 点 0, MAn) =n2+1 没有 固定 点 。 我 们 将 证 明 没 有 固定 点 的 函数 是 不 可 数 的 。 
这 个 证 明 类 似 于 证 明 从 N 到 N 的 所 有 自然 数 的 数目 是 不 可 数 的 ， 除 非 我 们 现在 有 一 个 附加 条 件 : Fg 
造 不 在 序列 中 的 元 素 。 

假设 没有 固定 点 的 函数 的 数量 是 可 数 的。 于 是 ， 这 些 函 数 就 可 以 列 出 来 ， 像 万 ,万 ， fy oo WT 
根据 我 们 的 假设 构造 矛盾 ， 我 们 构造 了 一 个 没有 固定 点 的 函数 ， 并 且 它 也 不 在 序列 中 。 考 虑 函数 
f(n) 2f, (n) «n1, EMS PRIN n +1 DRUESIT BUG ES nA f(n) >n。 因 此 了 没有 固定 点 。 类 似 于 
上 面 给 出 的 证 明 ， 对 于 所 有 的 i 有 (i) 关 fi(i)。 因 此 ， PP fi. he DETUR, HEARN 
可 以 得 出 结论 : 没有 固定 点 的 函数 的 数量 是 不 可 数 的 。 O 

1.4.4 了 P(N) 是 NN 的 子 集 的 集合 ,， 且 是 不 可 数 的 。 假 设 N 的 子 集 的 集合 是 可 数 的 ， BAN 
就 可 以 列举 出 来 No ,Ni ,N,,…。 定义 N 的 子 集 D 如 下 : 对 于 每 个 自然 数 j， 

jeD 当 且 仪 当 j¢N; 
根据 我 们 的 构造 ， 如 果 0 gg No。 则 0eD， WREN 则 1eD， 等 等 。 RA D 显然 是 自然 数 的 集合 。 根 
据 假 设 ，N, ,Ni ,NN,,… 是 N 的 子 集 的 无 穷 列举 。 因 此 ,对 于 任意 i 有 D = N,。 数 字 i 是否 属 于 集合 D 
We? 根据 D 的 定义 ， 

ieD4HfU5 ig N, 
但 是 因为 D = N;,， 所 以 就 变 成 

ieD 当 且 仅 当 ieD， 
这 是 矛盾 的 。 因 此 ， 我 们 的 假设 了 P(N) 是 可 数 的 是 错误 的 ， 于 是 我 们 得 出 结论 : 了 P(N) 是 不 可 数 的 。 

为 了 进一步 了 解 “ 对 角 化 ”技术 ,我 们 考虑 二 维 格 ， 它 的 横 轴 是 自然 数 ， 纵 轴 是 集合 NoN, 
N, o WREN, WAIT NAIZ j 确定 的 格 的 位 置 就 是 是 。 否 则 ， 就 是 否 。 考 虑 格 的 对 角 入 口 ， 即 
数字 j 和 集合 Nj 之 间 的 关系 ,我 们 可 以 构造 集合 D。 根 据 我 们 给 出 的 定义 D 的 方式 ,数字 jj 是 集合 D 
的 元 素 当 且 仅 当 NA j 对 应 的 位 置 的 入 口 处 是 否 。 L1 


1.5 对 角 化 和 自 反 


除了 可 以 用 于 证 明和 集合 的 基数 之 外 ;对 角 化 还 提供 了 一 种 用 于 描述 某 种 属性 或 关系 是 固有 矛盾 的 
方法 。 这 一 点 被 用 于 不 存在 性 的 证 明 当中 ， 因 为 没有 对 和 象 满足 这 个 性 质 。 不 存在 的 对 角 化 证 明 经 常 依 
赖 于 自 反 性 一 一 对 象 分 析 它 自身 的 行为 、 属 性 和 特点 。 罗 素 悖 论 、 图 灵机 停机 问题 的 不 确定 性 ， 以 及 
对 于 数论 的 不 确定 性 的 Gödel 证 明 都 是 基于 和 自 反 相关 的 矛盾 论 的 。 


前 面 小 节 中 使 用 的 对 角 化 证 明 使 用 了 表格 中 的 操作 ， 它 基于 纵 轴 上 的 操作 数 和 横 轴 上 的 参数 来 解 


释 操 作 数 和 参数 之 间 的 关系 。 在 每 个 例子 中 ， 操 作 数 和 它 的 参数 的 类 型 都 不 相同 。 在 自 反 中 ， 同 一 族 
的 对 象 包含 相同 的 操作 数 和 参数 。 我 们 使 用 理发 师 悖 论 ， 罗 素 悖 论 的 一 个 相当 简单 的 例子 ， 来 解释 对 
角 化 和 自 反 。 wl 

理发 师 悖 论 是 有 关 一 个 神秘 小 镇 中 的 谁 给 谁 理发 的 问题 的 。 我 们 被 告知 这 个 小 镇 中 的 男人 都 可 以 
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PA PER, 那么 在 第 i 行 、 第 j 列 的 位 置 就 是 1， 


10 B-RA EK m 





给 自己 理发 ， 而 小 镇 的 理发 师 (他 自己 就 是 一 个 男人 ) 只 给 那些 不 能 自己 理发 的 人 理发 。 我 们 希望 考 
虑 这 段 陈述 和 这 个 小 镇 存在 的 可 能 性 。 在 这 个 例子 里 , “小 镇 里 男人 的 集合 既是 操作 数 也 是 参数 。 我 们 
或 者 让 别人 来 给 我 们 理发 或 者 自己 理发 。 设 M = pi,p;,p;,…,p;,…| 是 小 镇 中 所 有 男性 的 集合 。 

图 表示 了 理发 关系 的 集合 。 从 图 中 可 以 看 出 ， 如 果 e es 


否则 就 是 0。 每 列 都 有 一 个 人 口 标 着 1， 其 他 的 人 
口 标 着 0。 每 个 人 或 者 自己 理发 ， 或 者 被 理发 师 理 ^ 
发 。 理 发 师 一 定 是 小 镇 中 的 成 员 之 一 ， 因 此 ， 他 一 7 
定 是 某 个 p,。 那 么 表格 中 i 行 j 列 的 位 置 的 值 是 多 C 
DUE? 这 是 一 个 经 典 的 自 反 问题 。 我 们 会 问 当 某 一 P 
个 对 象 既 是 操作 者 (理发 的 人 )， 又 是 被 操作 者 ` 
(被 理发 的 人 ) 时 ,会 发 生 什么 事情 ? 

谁 给 理发 师 理发 呢 ? 如 果 理 发 师 能 够 给 自己 理发 ， 但 是 实际 他 不 能 ， 因 为 他 只 给 不 能 自己 理发 的 
人 理发 。 如 果 他 不 给 自己 理发 ， 那 么 他 就 必须 给 自己 理发 因为 他 应 该 给 所 有 不 自己 理发 的 人 理发 。 我 
们 证 明了 这 个 小 镇 的 理发 属性 是 矛盾 的 ， 因 此 这 样 的 城镇 是 不 存在 的 。 

罗素 悖 论 遵循 了 相同 的 模式 ， 但 是 它 的 结论 要 远 比 神秘 小 镇 的 不 存在 更 重要 。 集 合 论 的 重要 原理 
之 一 就 是 任何 可 以 描述 出 来 的 性 质 或 条 件 都 可 以 用 来 定义 集合 ， 而 集合 就 是 由 满足 这 个 条 件 的 对 象 的 
构成 ， 这 是 19 世纪 晚期 Cantor 提出 的 。 可 能 没有 对 象 满足 这 个 性 质 ， 或 者 有 限 多 个 、 或 无 穷 多 个 对 
象 满足 这 个 性 质 。 不 管 元 素 的 数目 和 类 型 怎样 ， 这 些 元 素 都 构成 了 一 个 集合 。 罗 素 构 造 了 一 个 基于 自 
反 性 的 论证 ， 证 明了 这 个 命题 不 可 能 是 正确 的 。 





罗素 伴 论 考察 的 关系 是 一 个 集合 属于 另 一 个 集合 YY Vex? 
的 成 员 资格 。 对 于 每 个 集合 X， 我 们 问 这 样 一 个 间 ”1al [al 5 
题 ,“ 集 合 Y 是 否 是 集合 X 的 元 素 ?” 这 是 一 个 不 合 。 al obl lal 是 
理 的 问题 ， 因 为 一 个 集合 当然 可 以 是 另 一 个 集合 的 元 Nal 2.0 7 
素 。 右 边 的 表格 给 出 了 这 个 问题 的 肯定 和 否定 例子 。 | 和 1 add ial de 


值得 注意 的 是 ， 这 个 问题 不 是 集合 Y 是 否 是 集 
合 X 的 子 集 ， 而 是 它 是 否 是 集合 X 的 元 素 。 

成 员 资格 可 以 用 右面 的 表格 描述 。 其 中 ， 横 轴 
与 纵 轴 表 示 的 集合 。 表 项 [i,j] 是 1 表示 XX 是 集合 X 
X, 的 元 素 ， 而 0 表示 又 不 是 集合 X, 的 元 素 。 X; 

通过 识别 成 员 资格 问题 中 的 操作 符 和 操作 数 ， X 
我 们 可 以 获得 一 个 自 反 问题 。 即 : 我 们 问 集 合 X， | 
是 否 是 它 自身 的 元 素 。 前 面 的 表格 中 的 对 角 化 X 
[i, 让 包含 了 这 个 问题 的 回答 。“X, 是 X, 的 元 素 吗 ?” — 
现在 考察 一 个 集合 不 是 它 自身 的 元 素 。 根 据 这 个 性 
质 是 否 可 以 定义 一 个 集合 ? 有 很 多 实例 显然 满足 这 个 性 质 ， 集合 | al 不 是 它 自身 的 元 素 。 这 个 性 质 的 
满足 通过 对 角 化 的 补 来 体现 。 集 合 X, 不 是 它 自 身 的 元 素 当 且 仅 当 单元 [i,i] 是 0。 

假设 $=|X|XgX} 是 集合 。S 属于 'S 吗 ? 如 果 S 是 它 自身 的 元 素 ， 那 么 根据 S 的 定义 它 不 属于 
S。 而 且 ， 如 果 S 不 属于 S, 那么 它 必须 属于 S$， 因 为 它 不 是 它 自身 的 元 素 。 这 显然 是 矛盾 的 。 由 于 我 
们 的 假设 : 满足 属性 XeX 的 集合 的 全 体 构 成 一 个 集合 ， 所 以 这 是 矛盾 的 。 

我 们 给 出 了 一 个 可 描述 的 性 质 ， 但 是 它 却 不 能 用 来 定义 集合 。 这 就 表明 了 Cantor 关于 集合 的 普遍 
性 的 断言 是 错误 的 。 罗 素 悖 论 衍生 的 影响 更 是 深远 的 。 这 样 ， 集 合 论 的 研究 就 从 基于 简单 定义 的 基础 
转移 到 由 公理 和 推理 规则 构成 的 形式 化 系统 上 ， 并 帮助 开创 了 数学 的 形式 主义 哲学 。 在 第 12 章 我 们 
将 使 用 自 反 性 来 构造 计算 机 科学 理论 中 的 重要 结论 : 停机 问题 的 不 确定 性 。 











1.6 递归 定义 


事实 上 ， 在 形式 语言 和 自动 机 理论 中 ， 我 们 感 兴趣 的 许多 集合 都 有 无 穷 多 个 元 素 。 因 此 ， 我 们 有 
必要 寻找 一 种 方法 来 描述 、 产 生 和 识别 属于 无 穷 集合 的 元 素 。 在 前 面 的 小 节 中 ， 我们 使 用 省 略 号 
C) 表示 自然 数 的 集合 。 这 看 起 来 合理 ， 因 为 每 个 阅读 本 书 的 人 都 熟悉 自然 数 ,， 并 且 知 道 0，1，2 
3 后 面 是 什么 。 然 而 ， 这 个 定义 对 于 不 熟悉 基本 的 10 进 制 系统 和 数学 表示 的 人 而 言 可 能 是 完全 不 正确 
的 。 这 样 的 人 没有 这 样 的 概念 ， 即 符号 4 是 下 一 个 元 素 ， 而 1492 是 自然 数 。 

在 数学 理论 的 发 展 过 程 中 ， 像 语言 理论 或 自动 机 理论 ， 定 理 和 证 明 可 以 使 用 的 仅仅 是 相应 理论 的 
概念 定义 。 因 此 ， 这 就 需要 知道 相应 领域 的 对 象 和 操作 的 准确 定义 。 定 义 的 方法 必须 能 够 使 我 们 的 朋 
友 、 陌 生 人 或 没有 直觉 的 计算 机 能 够 产生 ， 并 “理解 ”集合 的 元 素 所 具有 的 性 质 。 

RE X 的 递归 定义 (recursive definition) 描述 了 构造 集合 元 素 的 方法 。 定 义 使 用 了 两 种 成 分 : 基 
础 和 操作 的 集合 。 基 础 包括 直接 指定 为 X 的 成 员 的 元 素 的 有 限 集合 。 操 作用 于 使 用 以 前 定义 的 成 员 来 
构造 集合 的 新 元 素 。 递 归 定 义 的 集合 X 包 括 所 有 由 集合 元 素 使 用 有 限 步 操作 获得 的 元 素 。 

这 个 递归 定义 集合 过 程 中 的 关键 词 是 产生 。 显 然 ， 没 有 过 程 可 以 列 出 自然 数 的 完整 集合 。 然 而 ， 
任何 特殊 数 都 可 以 按照 起 始 于 0， 并 构造 自然 数 序列 的 方式 获得 。- 这 从 本 质 上 描述 了 定义 自然 数 集合 
的 递归 过 程 。 这 个 想法 可 以 用 下 面 的 定义 形式 化 地 描述 出 来 。 

定义 1.6.1 自然 数 集合 N 的 递归 定义 是 使 用 后 继 函 数 8 构造 的 。 

i) 基础 步骤 : OEN 

i) 递归 步骤 : 如 果 neN， 那么 s(n)eN 

ii) 封闭 : ne N 只 有 当 它 可 以 由 0 经 过 有 限 步 应 用 操作 s 获得 。 

基础 步骤 直接 给 出 了 0 是 自然 数 。 在 (请) 中 ， 一 个 新 的 自然 数 通过 定义 过 的 数 和 后 继 操作 给 出 。 
ee es E E 定义 1.6.1 产生 了 无 穷 序 列 0， 
s(0)，s(s(0)),，s(s(s(0))),…。 这 个 序列 可 以 缩写 成 0，1，2，3,，…。 无 论 如 何 ， 可 以 用 熟悉 的 
阿拉 伯 数 字 措 巡 的 东西 ， 部 可 以 使 用 这 种 非 缩写 的 方式 来 完成 ， 

递归 过 程 的 本 质 是 使 用 同一 过 程 或 结构 的 简单 实例 来 定义 复杂 的 过 程 或 结构 。 在 自然 数 的 例子 
中 ,“ 简 单 ” 意 味 着 小 。 定 义 1.6.1 使 用 已 定义 过 的 数 来 递归 地 定义 一 个 新 数 。 

自然 数 被 定义 后 ， 如 何 理解 它们 的 性 质 呢 ? 我 们 通常 把 加 、 减 和 乘 的 操作 与 自然 数 联系 到 一 起 。 
我 们 通过 强迫 ， 或 者 是 记忆 或 是 简单 的 重复 的 方式 学 习 这 些 。 对 于 不 熟悉 这 个 操作 的 人 ， 或 者 是 要 进 
行 加 运算 的 人 而 言 ， 就 必须 正确 定义 加 的 概念 。 一 个 人 不 可 能 记 住 自然 数 的 所 有 可 能 组 合 ， 但 是 我 们 
可 以 递归 地 构造 一 个 方法 来 计算 任何 两 个 数 的 和 。 后 继 函 数 是 引入 到 自然 数 上 的 惟一 操作 。 因 此 ， 加 
的 定义 可 以 仅 使 用 0 和 so 

定义 1.6.2 下 面 递 归 定 义 了 m 和 nn 的 和 ,递归 发 生 在 n 上 一 一 和 操作 的 第 二 个 操作 数 。 

i) 基础 步骤 : 如 果 n=0， 那么 m+n=m。 

ii) 递归 步骤 : m+s(n) =s(m+n)。 

ii) 封闭 : m+n=k 仅 当 这 个 等 式 可 以 从 m+0=m 开始 使 用 有 限 步 递归 步骤 获得 。 

给 定 的 域 中 ， 封 闭 这 一 步 在 操作 的 递归 定义 中 常常 被 省 略 。 在 这 个 例子 中 ,假设 这 个 操作 是 定义 
在 定义 域 的 所 有 元 素 上 的 。 上 面 给 出 的 加 操作 就 是 定义 在 N x N 的 所 有 元 素 上 的 。 

n 的 后 继 与 m 的 和 ,使 用 简单 的 例子 来 定义 的 ， 就 是 m 和 的 和 的 后 继 操 作 。 作 为 递归 操作 对 象 
n 的 选择 是 任意 的 ; 在 给 定 n 之 后 ，m 的 操作 也 可 以 这 样 定义 。 

依据 定义 1.6. 2 中 给 出 的 构造 ， 任何 两 个 自然 数 的 和 可 以 使 用 0 和 s 来 计算 。 其 中 ， 0 和 s 是 定义 
自然 数 的 基本 元 素 。 例 1. 6. 1 给 出 了 3 +2 的 递归 计算 过 程 。 
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例 1.6.1 数字 3 和 2 分 别 是 s(s(s(0))) 和 s(s(0)) 的 缩写 。 它 们 的 和 递归 地 定义 为 


s(s(s(0))) +s(s(0)) 
=s(s(s(s(0))) +s(0)) 
=s(s(s(s(s(0))) +0)) 
=s(s(s(s(s(0))))) (基础 ) 
最 终 的 值 就 是 数字 5 的 表示 。 口 
图 1-1 解释 了 由 基础 Xo 生 成 集合 X 的 递归 过 程 。 每 个 同心 
圈 表 示 构 造 的 一 个 步骤 。X, 表示 基础 元 素 ， 以 及 由 它们 使 用 一 
步 操作 获得 的 元 素 。X; 包 括 经 过 不 超过 i 步 操 作 获 得 的 元 素 。 
在 递归 定义 的 生成 过 程 中 产生 了 一 个 可 数 的 有 限 序列 的 符 套 集 
合 。 集 合 X 可 以 看 作 是 X, 的 无 穷 并 。 设 x 是 X 的 元 素 ， 并 且 X， 
是 x 出 现 的 第 一 个 集合 。 这 就 意味 着 x 可 以 由 基本 元 素 经 过 j 步 
操作 获得 。 尽 管 X 的 每 个 元 素 都 可 以 通过 操作 的 有 限 次 应 用 而 
获得 ,但 是 应 用 的 步骤 是 没有 上 限 的 。 这 种 使 用 有 限 但 是 无 限 
步骤 生成 的 性 质 ， 就 是 递归 定义 的 重要 性 质 。 
后 继 操作 可 以 用 来 递归 地 定义 N xN 上 的 关系 。 笛 卡 儿 乘 
E N x N 经 常 使 用 格 上 的 表示 有 序 对 的 点 来 描绘 。 遵 循 标准 惯 





X 的 递归 生成 : 

Xo={x|x 是 基础 元 素 } 

X,47X,U {xlx 可 以 通过 i+1 步 操作 生成 } 
X={x| 对 于 某 些 } 宇 0，x EX} 


1-1 :递归 定义 集合 的 艇 套 序列 


例 ， 横 轴 表 示 有 序 对 的 第 一 个 元 素 ， 纵 轴 表 示 第 三 个 。 图 1-2 (a) 的 阴影 包含 所 有 的 有 序 对 [i,j]， 
其 中 i<j。 根据 1.2 节 的 描述 ， 这 个 集合 就 是 1.2 节 描 述 的 小 于 关系 LT。 
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(a) - 
图 1-2 NxN 上 的 关系 


例 1.6.2 关系 LT 定义 如 下 : 
i) 基础 步骤 : [0,1] eLT, 


(b) 


ii) 递归 步骤 : 如 果 [m,n] |eLT, 那么 [m,s(n)] eLTJÉBR(s(m) ,s(n)] ELT. 
ii) 封闭 : [m,n] eLT 只 有 当 它 可 以 由 [0,1] 经 过 有 限 步 递归 操作 得 到 。 
使 用 递归 生成 的 无 穷 并 描述 ，LT 的 定义 生成 了 谋 套 集合 的 序列 LT,， 使 得 


LT, = ([0,1]] 
Ut; ET £6,21,[1;2]] 
LT, =LT, U1[0,3],[1,3],[2,3]] 


LT, ZLT;U1[0,4],[1,4],[2,4],[3,4]] 


LT, =LT,_,U | [j,i+1] |j20,1,:- 


,i 
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LT 的 构造 说 明了 递归 定义 的 元 素 的 生成 过 程 并 不 一 定 是 惟一 的 。 有 序 对 [1,3] eLT, 可 以 通过 下 
面 两 个 不 同 的 操作 序列 获得 。 
基础 : [0,1] [0,1] 
1: [0,5(1)] 2 [0,2] [s(0),5(1) ] 2 [1,2] 
2: [s(0),5(2)] [1,3] [1,s(2)]=[1,3]. 
例 1.6.3 图 1-2 (b) 的 阴影 区 域 包含 了 所 有 第 二 个 元 素 是 3，4,，5 或 6 的 有 序 对 。 这 个 集合 的 
递归 定义 称 为 X: 
i) 基础 步骤 : [0,3], [0,4], [0,5] M[0,6]# RF X. 
ii) 递归 步 又: UWR[m,n]eX, JSA[s(m),n]eX. 
ii) 封闭 : [m,n] esX， 只 有 当 它 可 以 由 基础 元 素 经 过 有 限 步 应 用 操作 获得 。 
集合 X 的 序列 可 以 按照 下 面 的 方式 递归 定义 来 生成 : 
X5 11531,5541. L/,51,[/,6147 20,1; 4]. 口 


1.7 数学 归纳 


构造 集合 元 素 和 这 个 集合 王 的 操作 之 间 的 关系 ， 需 要 通过 证 明 来 验证 你 所 假定 的 性 质 。 我 们 如 果 
仅仅 考虑 单个 元 素 ， 是 无 法 证 明 性 质 对 于 无 穷 集合 中 的 每 个 元 素 都 是 成 立 的 。 数 学 归纳 的 原理 为 证 明 
一 个 性 质 对 于 给 定 集合 中 的 每 个 元 素 都 成 立 提供 了 充分 的 依据 。 归纳 利用 递归 过 程 生成 的 撕 套 集合 
族 ， 把 它 的 性 质 从 一 些 基础 元 素 拓展 到 整个 集合 上 。 

数学 归纳 的 原理 设 和 是 由 基础 和 通过 递归 定义 的 集合 ， 并 且 XX ,X, ,…,Xi,，… 是 利用 递归 
生成 的 集合 序列 。 已 知 P 是 义 元 素 的 性 质 。 如 果 能 够 证 明 ; 

i) P 对 于 集合 Xo 中 的 所 有 元 素 都 成 立 ， 

i) 当 卫 对 于 集合 X ,X ,X, ，…,X，… 中 的 所 有 元 素 都 成 立 ， 那 么 卫 对 于 Xi, 中 的 每 个 元 素 也 

RE. 
那么 ,根据 数学 归纳 的 原理 ，P 对 于 XX 中 的 每 个 元 素 都 成 立 。 

数学 归纳 原理 的 正确 性 可 以 使 用 在 递归 定义 X 的 过 程 中 构造 的 集合 序列 来 给 出 直观 的 展示 。 把 圈 
X, 涂 上 阴影 表示 了 对 于 X, 中 的 每 个 元 素 都 成 立 。 第 一 个 条 件 要 求 内 部 集合 涂 阴影 。 条 件 (ii) 声明 阴 
影 部 分 可 以 从 任何 圆 图 扩展 到 下 一 个 同心 圈 。 图 1-3 解释 了 这 个 过 程 是 如 何 最 终 把 整个 集合 X 涂 上 阴 
影 的 。 

根据 前 面 的 论证 ,我 们 可 以 清楚 地 了 解 到 数学 归纳 原理 的 合理 性 。 假 设 条 件 (i) 和 条 件 (Gu) 得 
到 满足 ,但 是 P 并 不 能 使 X 中 的 每 个 元 素 都 成 立 ， 这 样 就 获得 了 另 一 个 合理 性 。 如 果 P 不 能 对 XX 中 
的 所 有 元 素 成 立 ， 那 么 至 少 有 一 个 集合 X; 不 满足 P。 设 X, 是 第 一 个 这 样 的 集合 。 因 为 条 件 (i) 保证 
P 对 于 X, 中 所 有 的 元 素 成 立 ， 所 以 j 不 可 能 是 0。 现 在 假设 我 们 选择 j， 使 得 P 对 于 X,_, 中 的 所 有 元 素 
都 成 立 。 条件 GD 要 求 P 对 于 X, 中 的 所 有 元 素 都 成 立 。 这 就 意味 着 在 序列 中 不 存在 第 一 个 集合 使 得 
性 质 P 不成立。 因此，P 一 定 是 对 于 所 有 的 X, 都 成 立 的 ， 于 是 对 于 和 X 成 立 。 

归纳 证 明 包括 三 个 步骤 。 第 一 步 是 证 明 性 质 P 对 于 基础 集合 中 的 每 个 元 素 都 成 立 。 这 对 应 于 建立 
数学 归纳 原理 的 条 件 (i) 。 第 二 条 是 归纳 假设 的 陈述 。 归 纳 假设 就 是 假设 性 质 P 对 于 集合 XX ,…， 
X, 中 的 每 个 元 素 都 成 立 。 使 用 归纳 假设 时 ， 归 纳 步骤 证 明了 了 可 以 扩充 到 X, 的 每 个 元 素 。 当 我 们 完 
成 归纳 步骤 时 ， 数 学 归纳 原理 的 条 件 也 就 全 部 得 到 了 满足 。 于 是 就 可 以 得 出 结论 ，P 对 于 X 中 的 所 有 
元 素 都 成 立 。 

在 例 1.6.2 中 ,我 们 给 出 了 一 个 用 以 生成 关系 LT 的 递归 定义 ， 在 这 个 关系 中 我 们 考虑 的 就 是 满 
fi <j 的 有 序 对 [i,j] 。 根 据 这 个 定义 生成 的 每 个 有 序 对 都 满足 这 个 不 等 关系 吗 ? 我 们 将 利用 这 个 问题 
来 解释 在 递归 定义 的 集合 中 的 归纳 证 明 步 又。 

第 一 步 是 直接 说 明 集合 中 的 所 有 元 素 都 满足 不 等 式 。LT 递归 定义 的 基础 是 集合 |[0,1]|。 因 为 
0 <1， 所 以 归纳 证 明 的 基础 步骤 得 到 了 满足 。 





[26 | 





27 











14 > 98$—92 EK a 








图 1-3 数学 归纳 的 原理 


归纳 假设 说 明 假设 x<y 对 于 所 有 有 序 对 [x,y] e LT, 都 成 立 。 在 这 个 归纳 步 又 中 ， 我 们 必须 证 明 
对 于 所 有 有 序 对 [i,j] e LT,,, 来 说 i<j 都 成 立 。LT 定义 的 递归 步骤 建立 了 集合 LT,,, LT, 之 间 的 关 


系 。 设 [x,y] 是 LT,,, 中 的 有 序 对 ， 那 么 对 于 任意 的 [zx,y] e LT, 288 [4] =[x,s(y)] 或 者 [i,j] = 


[s(x) ,s(y) ] 。 于 是 根据 归纳 假设 就 有 x*<ye。 WEL] 2 [x,s (21, BA 

i=x<y<s(y) =. 
ibis, tij] =[s(x),s(y)], WA 

i2s(Xx)-«s(y) sp 

不 管 哪 种 情况 均 有 i<j， 并 且 不 等 关系 扩展 到 了 LT,,, 上 的 所 有 有 序 对 。 这 就 完成 了 要 求 的 归纳 证 明 ， 
因此 不 等 关系 对 于 LT 中 的 所 有 有 序 对 都 成 立 。 

在 证 明 关系 LT 中 的 每 个 有 序 对 [i, 站 都 满足 i<j 时 ， 归 纳 步 又 仅 仅 使 用 了 假设 : 性 质 对 于 利用 递 
归 步 又 以 前 生成 的 元 素 都 成 立 。 这 种 证 明 有 时 称 为 简单 归纳 (simple induction) 。 当 归纳 步骤 使 用 全 部 
的 归纳 假设 时 一 一 性 质 对 于 所 有 以 前 产生 的 元 素 都 成 立 称 为 强 归 纳 (strong induction)。 例 1.7.1 
使 用 强 归 纳 来 建立 数学 表达 式 中 操作 数 的 数目 和 括号 的 数目 之 间 的 关系 。 

例 1.7.1 ”数学 表达 式 的 集合 EE 使 用 符号 ia,bi ， 操 作 符 + 和- ， 以 及 括号 ， 定 义 如 下 : 

i) RGR: a Alb MRF E 

ii) 递归 步骤 : WRu vIRT E, JA (uev). (u-v) A( -v) MWA T Eo 

ii) 封闭 : 表达 式 属于 E 则 它 可 以 由 基础 有 限 步 应 用 递归 步骤 获得 。 

递归 定义 产生 的 在 递归 应 用 第 一 、 第 二 和 第 三 步 中 的 表达 式 分 别 是 (a b), (a (b+b)) 和 
((a+a) -(b-a))。 我 们 使 用 归纳 来 证 明 表 达 式 u 中 括号 的 数目 是 操作 符 数 目的 二 倍 。 即 : n, (u) = 
2n,(u)， 其 中 ，n,(u) 表 示 u 中 插 号 的 数目 ， 而 n (4) 表 示 操 作 符 的 个 数 。 

基础 步骤 : 包含 表达 式 a H b 的 归纳 的 基础 。 在 这 里 , n,(a) =0=2n,(a), 并且 n,(b) =2n,(b)。 

归纳 假设 : 假设 不 超过 nn 次 使 用 递归 步 又 得 到 的 表达 式 都 满足 n, (u) 22n,(u) ， 那 么 uw 总 属于 Eno 

归纳 步骤 : 设 w 是 n+1 次 应 用 递归 步骤 获得 的 表达 式 。 那 么 w= (u+v),w=(u-v) 或 者 w= 
( -v)， 其 中 , u 和 vv 都 是 E, 中 的 表达 式 。 根 据 归纳 假设 ， 
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n,(u) =2n,(u) 
n,(v) =2n,(v). 
如 果 w=(u+v) 或 者 w= (u-v) 
n,(w) =n,(u) +n,(v) +2 
n,(w) =n,(u) +n,(v) +1. 
因此 ， 
2n,(w) =2n,(u) +2n,(v) +2 =n,(u) +n,(v) +2 =n,(w). 
tf w=(-v), AA 
2n,(w) =2(n,(v) +1) =2n,(v) +2 =n,(v) +2 =n,(w). 

因此 性 质 n, (w) =2n,(w) 对 于 所 有 的 we EE,,, 都 成 立 。 于 是 ,我 们 根据 数学 归纳 得 出 结论 ， 对 于 E 中 
的 所 有 表达 式 都 是 正确 的 。 口 

归纳 证 明 经 常 使 用 自然 数 作为 潜在 的 递归 定义 集合 。 递 归 定 义 的 集合 使 用 的 是 定义 1. 6. 1 中 给 出 
的 基础 101。 第 n 步 应 用 递归 步骤 产生 了 自然 数 n， 相 应 的 归纳 步骤 把 性 质 推 广 ， 使 之 从 0，…, 7 到 
n+1 都 得 到 满足 。 

例 1.7.2 用 数学 归纳 法 来 证 明 0+1+…+n=n(n+1)/2。 使 用 和 式 ， 我 们 可 以 把 前 面 的 表达 式 
记 成 

kd i=n(n+1)/2. 
EAR: MMSE n= 0, RIL GEHE EL AER AR HE LU. 
y i=0=0(0+1)/2. 
归纳 假设 ; 假设 对 于 所 有 的 值 上 1，2，……， 有 
Y. i=k(k+1)/2. 
归纳 步骤: 我 们 需要 证 明 
» iz(n*1)(n*141)/22 (n1) (n*2)72. 

归纳 假设 构造 了 包含 n 个 或 数目 更 少 的 整数 的 序列 的 和 来 作为 结果 。 与 归纳 假设 相 结 合 ， 我 们 可 以 得 到 


Vis Y, i+ (n+l) (+ 的 联合 ) 

ny (归纳 假设 ) 
=(n+1)(n/2 +1) (分 配 性 质 ) 
=(n+1)(n+2)/2. 


既然 我 们 可 以 构造 数学 归纳 原理 的 条 件 ， 那 我 们 就 可 以 得 出 结论 ， 即 对 于 所 有 的 自然 数 都 成 立 。 口 

证 明 的 每 一 步 都 必须 遵循 前 面 操作 数 和 归纳 假设 中 构造 的 性 质 。 归 纳 证 明 的 策略 是 使 用 公式 涵盖 
应 用 于 简单 例子 的 性 质 实例 。 完 成 这 些 之 后 ， 就 可 以 使 用 归纳 假设 了 。 使 用 归纳 假设 之 后 ， 剩 下 的 证 
明 部 分 经 常 包括 使 用 一 些 代数 操作 来 构造 目标 结果 。 


1.8 有 向 图 


数学 结构 包含 集合 、 集 合 中 的 可 区 分 元 素 和 集合 上 的 函数 和 关系 。 可 区 分 元 素 (distinguished ele- 
ment) 指 的 是 这 个 集合 中 的 具有 区 别 于 其 他 元 素 的 性 质 的 元 素 。 根 据 定义 1.6.1， 自 然 数 可 以 表示 成 
(N, s, 0) 的 结构 。 集 合 N 包含 自然 数 ，s 是 N 上 的 一 元 函数 , 0 是 N 中 的 可 区 分 元 素 。0 之 所 以 是 
可 区 分 的 ， 是 因为 它 在 自然 数 定义 中 的 重要 作用 。 

图 经 常 被 用 来 描绘 图 中 的 数学 实体 的 本 质 特点 ， 这 种 图 可 以 辅助 人 们 直观 地 理解 这 些 概 念 。 从 形 
式 上 而 言 ， 有 向 图 (directed graph) 是 包含 集合 N 和 它 上 面 的 二 元 关系 A 的 数学 结构 。N 的 元 素 称 为 





[33] 
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图 的 节点 (node) 或 顶点 (vertices), ifj A MICH MAM (arc) 或 边 (edge), KARA 是 邻接 (adja- 
cency) KA. [x,y] e A， 则 节点 y 是 邻接 x 的 。 有 向 图 中 从 x 到 y AA x Bl y 的 带 箭头 的 直线 表 
示 。 在 这 个 带 箭头 的 图 中 ，y 就 是 弧 的 头 , 而 x 是 弧 尾 。 节 点 x 的 人 度 (in-degree) 是 以 x 为 头 的 弧 的 
数目 。x 的 出 度 (out-degree) 是 以 它 为 尾 的 弧 的 数目 。 图 1-4 中 节点 a 的 人 度 为 2， 出 度 是 1。 


N={a, b, c, d) 
A- ([a, b], [b, a], [b, c], 


[b, d], [e, b], [e, d], 
Id, a], [d, d ]} 





图 1-4 有 向 图 


有 向 图 G=(N,A) 中 从 节点 x 到 节点 y 的 路 径 (path). 是 节点 和 弧 的 序列 如 [xx 12 Dx], 
LX] Xn EIE X= xy =。 节点 x 是 路 径 的 初始 节点 ，y 是 终点 。 路 径 上 的 每 对 节点 
X; X, SER [ x, ,xi,1 | 相连。 路径 的 长 度 就 是 路 径 上 弧 的 数目 。 我 们 经 常 使 用 弧 的 序列 来 描述 路 径 。 

从 任何 节点 到 它 自 身 都 有 一 条 长 度 为 0 的 路 径 ， 这 种 路 径 称 为 空 路 径 (null path) 。 起 始 于 同一 节 
点 的 长 度 不 小 于 1 的 路 径 称 为 回路 (cycle)。 如 果 一 个 回路 不 包含 任何 子 回 路 ， 那 么 这 个 回路 是 简单 
的 。 图 1-4 中 的 路 径 [a, b], [b, c], [c, d], [d, a] 就 是 一 个 长 度 为 4 的 简单 回路 。 至 少 包含 一 
个 回路 的 有 向 图 称 为 有 环 图 (cyclic)。 没有 回路 的 图 称 为 无 环 图 (acyclic) 。 

有 向 图 中 的 弧 不 仅 包含 节点 的 邻接 。 带 标记 的 有 向 图 是 (N, L, A) 结构 ， 其 中 工 是 标记 的 集 
A, A 是 NxNxL 上 的 关系 。 元 素 [x,y,v] e A 是 从 x 到 y 的 标记 为 v 的 弧 。 弧 上 的 标记 记录 着 相 邻 
节点 的 关系 。 图 1-5 上 的 标记 给 出 了 从 Chicago 到 Minneapolis, Seattle, San Francisco, Dallas 和 
St. Louis 以 及 回 Chicago 的 旅程 的 距离 。 







San Francisco 


633 miles 






Dallas 


图 1-5 ， 带 标记 的 有 向 图 
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一 个 有 序 树 (ordered tree) 或 者 仅 是 一 棵 树 、 就 是 一 个 无 环 有 向 图 ， 并且 它 的 每 个 节点 都 有 惟 

一 一 条 从 树 的 根 (root) 到 该 节点 的 路 径 。 根 也 是 一 种 特殊 的 节点 。 根 的 入 度 为 0， 而 其 他 节点 的 入 

度 都 是 1。 树 的 结构 是 (N, A, r), 其中,，N 是 节点 的 集合 ，A 是 邻接 关系 ,而 re N 是 树 的 根 。 

a “ 树 ” 既 包含 了 家 族 树 (Family Tree) 的 概念 ， 又 包含 了 树 作为 植物 的 本 质 的 

概念 。 尽 管 树 也 是 有 向 图 ， 但 是 弧 上 的 箭头 通常 在 树 的 图 形 表示 中 被 省 略 。 图 1-6;(a) 给 出 根 为 为 
的 树 T, 


dee trig x, 
* ^ Is 
P Et jos X Xg 
Xy Xs Xe xX, Xs | 
wer PS | Xiz 
Xg Xo Xn Xi "e 
Pd Xiz Xu 
Xu Xu 
(a) (b) 


图 1-6 (a) MRA x, 的 树 ;(b) x, 生成 的 子 树 


WAR y 邻接 于 x， 节 点 3 叫做 节点 x 的 子 节点 (child), x 是 y 的 父 节点 。 与 邻接 关系 相伴 的 概念 
是 任何 节点 的 子 节点 的 顺序 。 当 描绘 一 棵 树 时 ,我们 通常 按照 从 左 到 右 的 顺序 列 出 节点 的 子 节点 。 尼 
在 T 上 的 子 节点 按 顺序 是 x,，xs Al x, 

出 度 为 0 的 节点 称 为 叶子 (leaf) 。 所 有 其 他 的 节点 都 是 中 间 节 点 。 根 的 深度 (depth) 是 0， 任 何 


其 他 节点 的 深度 都 是 这 些 节 点 的 父 节 点 的 深度 加 一 。 树 的 高 度 或 深度 就 是 树 中 的 节点 的 深度 的 最 ， 


大 值 。 

如 果 从 x 到 yy 存在 一 条 路 经 ， 那 么 节点 y 称 作 节 点 x 的 后 代 (descendant), x 是 y 的 祖先 (ances- 
tor)。 根 据 这 个 定义 ， 每 个 节点 都 是 它 自身 的 后 代 和 和 祖先。 祖先 和 后 代 的 关系 可 以 使 用 相 邻 关系 ( 练 
习 43 和 练习 44) 来 递归 地 定义 。 两 个 节点 x 和 y 的 最 小 共同 祖先 (minimal common ancestor) 是 它们 
共同 祖先 中 的 一 个 ,并且 是 这 些 共同 祖先 的 后 代 。 在 图 1-6 (a) 的 树种 ，xi。 和 x 的 最 小 共同 祖先 是 
Xs, M x x, 的 最 小 共同 祖先 是 x,，xio 和 x 的 是 x。 

树 工 的 子 树 是 IT 的 子 图 ,并且 根据 子 树 自 身 的 特点 决定 它 也 是 棵 树 。 节 点 类 后 代 的 集合 和 这 个 集 
合 的 邻接 关系 的 限制 构成 了 以 x 为 根 的 子 树 。 这 个 树 就 叫做 x 生成 的 子 树 。 

树 中 兄弟 的 排序 可 以 扩展 到 N xN 上 的 关系 LEFTOF, LEFTOF 试图 获取 树 的 图 中 每 个 节点 左边 
节点 的 性 质 。 对 于 两 个 节点 x 和 y， 它 们 中 的 任何 一 个 都 不 是 另 一 个 的 祖先 。 关 系 LEFTOF 是 根据 节 
点 的 最 小 共同 祖先 生成 的 子 树 来 定义 的 。 设 z 是 x 和 y 的 最 小 共同 祖先 ， 并且 zs n. cc. oz 顺 次 是 z 
的 子 节点 。 那 么 x 就 是 由 z 的 子 节点 生成 的 子 树 ， 记 作 z;。 类 似 地 ， 对 于 某 个 j, y 是 z 生成 的 子 树 。 
因为 z 是 x 和 y 的 最 小 共同 祖先 ，ij。 如 果 i<j， 那么 [x,y] e LEFTOF; 否则 [y,x] eLEFTOF。 根 据 
这 个 定义 ,没有 节点 是 LEFTOP 的 祖先 。 如 果 x, fe x, WAY, MA xio 就 必须 在 x 的 左边 ， 因 为 它们 
都 是 它们 父 节点 的 第 一 个 子 节点 。 这 种 存在 于 一 个 祖先 的 左边 或 右边 的 现象 是 这 个 图 的 特点 之 一 ， 而 
不 是 节点 排序 的 性 质 。 

关系 LEFTOF 可 以 用 来 给 树 中 的 叶子 排序 。 树 的 边界 (frontier) 应 该 从 叶子 开始 ,按照 LEFTOF 
关系 的 顺序 构造 so 了 的 边界 是 序列 吉 ， Xo. Xa. Xe, Xia» Xian Xo 

当 一 族 图 递归 地 被 定义 后 ， 数学 归纳 的 原理 就 可 以 被 用 来 证 明 这 些 性 质 对 整个 族 的 所 有 图 都 成 立 
了 。 我 们 将 使 用 归纳 来 演示 严格 二 又 树 每 个 节点 有 一 个 叶子 或 者 有 两 个 子 节点 构成 的 图 中 叶 的 数目 和 
弧 的 数目 的 关系 。 

例 1.8.1 每 个 节点 至 多 有 两 个 子 节点 的 树 称 作 二 叉 树 (binary tree)。 如 果 每 个 节点 都 是 叶子 ， 
或 者 正好 有 两 个 子 节点 ， 那 么 这 样 的 树 叫 做 严格 二 又 。 严 格 二 又 树 的 家 族 可 以 递归 地 定义 如 下 : 


[34] 
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i) 基础 步骤 : 有 向 图 T=( |r| Or) BRO, 


ii) 递归 步骤 : MIT, =(N,,A,,7,) RIT, = (NN; ,A,,r,) 痢 是 严格 二 又 树 ， 其 中 N, ALN, 不 相连 ， 


并 且 reN,UN,, 那么 


T=(N,UN,U{r},A,UA,U{[7,7,], [7,4] }5r) 


是 个 严格 三 又 树 。 


iii) 封闭 : 仅 当 工 能 够 从 基本 元 素 开 始 ， 应 用 有 限 的 递归 步骤 构造 出 来 ，T 才 是 一 个 严格 二 叉 树 。 

严格 二 又 树 或 者 是 一 个 单个 节点 ,或 者 是 在 两 个 严格 独立 的 二 叉 树 中 间 添 加 根 和 弧 来 构成 。 设 
iv(T) 和 arc(T) 表 示 严 格 二 叉 树 中 叶 和 弧 的 数目 。 我 们 通过 归纳 法 证 明了 对 于 所 有 的 严格 二 又 树 都 有 
2lv( T) -2-arc(T), 


基础 步骤 : 基础 步骤 包括 严格 二 叉 树 ， 形 如 ( 和 +} ,g@,r) 。 在 这 个 例子 中 ， 


等 式 明显 成 立 ， 因 为 这 种 形式 的 树 有 一 个 叶 节 点 ,而且 没 有 弧 。 


归纳 假设 : 假设 使 用 不 超过 n 步 应 用 递归 步骤 生成 的 每 个 严格 二 叉 树 T 


都 满足 2v(T) -2-arc(T), 


归纳 步骤 : 设 T 是 经 过 n+1 步 应 用 递归 步骤 生成 的 严格 二 叉 树 。T 是 由 
节点 上 和 两 个 以 前 构造 的 严格 二 又 树 T 和 T, 构造 的 ， 它 们 的 根 分 别 是 r, A ro 


n 


A A 


节点 “不 是 叶 节点 ， 因 为 它 有 到 T AT, 根 节点 构成 的 弧 。 因 此 ,Ww(T) =W(T,) € (T). TH 
弧 包 括 它 的 构成 树 的 弧 和 从 了 开始 的 两 条 弧 。 
因为 T, A T, 都 是 经 过 不 超过 n 步 应 用 递归 步骤 而 生成 的 严格 二 叉 树 ， 所 以 我 们 能 应 用 归纳 假设 
构造 目标 等 式 。 根 据 归纳 假设 ， 


2lv(T,) -2 =arc(T,) 
2lv(T,) -2 =arc(T,). 


这 样 ， 


u^ 


UF 


* 


arc(T) =arc(T,) +arc(T,) +2 
=2lv(T,) -2 +2lv(T,) -2+2 
=2(lv(T,) * Iv(T;)) -2 
z2(lv(T)) -2. 


9 练习 


已 知 X= 11,2,3,4| ，Y = 10,2,4,61。 给 出 下 面 集合 的 显 式 定义 。 
a) XUY b) XNY 

c) X-Y d) Y-X 

e) P(X) 


SAL X STa b.c, X112. 


a) 列 出 X 的 所 有 子 集 
b) JE X xY 的 成 员 
c) JEMA Y F X 的 所 有 全 函数 


. BEA X213" [n»0], Y={3n|n>0}, 证明 XC Y, 


BAIX = {n +3n? +3n| n20], Y2 i5 -1| n20] , ERA X - Y, 


. 证 明 德 摩根 定律 。 使 用 集合 相等 的 定义 来 构造 恒等式 。 
. 给 出 满足 下 面条 件 的 函数 ] : NN, 


a) f 是 全 函数 上 且 为 一 对 一 的 映射 ， 但 不 是 满 射 。 

b) f 是 全 函数 和 满 射 ， 但 不 是 一 对 一 的 映射 。 

c) f 是 全 函数 、 一 对 一 的 映射 和 满 射 但 不 是 恒等式 。 
d) f 不 是 全 函数 ,但 是 满 射 。 


. WEB]: 使 用 f(n) =n? +1 定义 的 函数 f: NON 是 一 对 一 的 映射 ， 但 不 是 满 射 。 
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. 已 知 f : R' OR' RRA f(x) =1/x 定 义 的 函数 ， 其 中 ，R' 表示 正 实数 的 集合 。 证 明 f 是 一 对 一 的 映射 ， 


但 不 是 满 射 。 


. 给 出 分 别 满足 下 面条 件 的 NxN 上 的 二 元 关系 。 


a) 自 反 、 对 称 、 但 不 传递 。 
b) 自 反 、 传 递 、 但 不 对 称 。 
c) 对 称 、 传 递 、 但 自 反 。 


已 知 当 且 仅 当 n=m 时 ， = 是 N 上 根据 n=m 定义 的 二 元 关系 。 证 明 == 是 等 价 关 系 ， 并 且 描 述 = 的 等 价 


类 。 


- 对 于 所 有 的 n,me N,， 根据 n=m 定义 N 上 的 二 元 关系 三 。 证 明 = 是 等 价 关系 ， 并 描述 = 上 的 等 价 类 。 
. 证 明 二 元 关系 LT (小 于 ) 不 是 等 价 关系 。 
已 知 如 果 n mod p =m mod p， 则 可 以 根据 n=bm 定义 N 上 的 二 元 关系 三 bp。 对 于 p2， 证 明 =, 是 等 价 


关系 。 描 述 =" 的 等 价 类 。 


已 知 X, ,…,X, ERE X 的 划分 。 请 定义 X 上 的 等 价 关 系 三 ， 其 中 义 的 等 价 类 就 是 集合 X, XS 
. 二 元 关系 三 是 按照 下 面 关 系 定义 的 自然 数 的 有 序 对 : [m,n]=[j;,k] ， 当 且 仅 当 m+k=n+j。 证明 = 是 


NxN 上 的 等 价 关 系 。 


. 证 明 偶 自 然 数 的 集合 是 可 数 的 。 

. 证 明 偶 整数 的 集合 是 可 数 的 。 

- 证 明 非 负 有 理 数 的 集合 是 可 数 的 。 

. 证 明 两 个 不 相交 可 数 集合 的 交 也 是 可 数 的 。 

. 证 明 从 N 到 10,1| 存 在 不 可 数 个 全 函数 。 

. 如 果 对 于 任意 的 ne N ABA f(n) =f(n+1)， 则 从 NN 到 对 的 全 函数 称 作 重复 (repeating)， 否 则 , f 就 是 


不 重复 的 。 证 明 存 在 数量 不 可 数 的 重复 函数 ， 并 且 证 明 存 在 数量 也 不 可 数 的 非 重 复 函 数 。 


- 如 果 对 于 所 有 的 ne N 都 有 f(n) <f(n +1), BAN 到 NN 的 全 函数 是 单调 增加 的 (monotone increas- 


ing) 。 证 明 存在 不 可 数 的 单调 增加 函数 。 


- 证 明 从 N 到 NN 的 映射 中 存在 着 不 可 数 个 具有 固定 点 的 全 函数 。 固 定点 的 定义 参照 例 1.4.3。 
- 如 果 对 于 每 个 ABA f(r) =n-1, nn 或 n+1， 那 么 就 称 从 NN 到 NN 的 全 函数 /是 几乎 恒 等 的 〈nearly 


identity) 。 证 明 存在 不 可 数 的 几乎 恒 等 函 数 。 


. 证 明 区 间 [0,1] 中 的 实数 集合 是 不 可 数 的 s 提示 : 在 实数 的 十 进 制 扩展 中 使 用 对 角 化 论证 。 确 定 每 个 自 


然 数 都 使 用 惟一 的 无 穷 十 进 制 扩展 表示 。 


. 已 知 F 是 形 如 f: (0,11 —N. (从 10,1} 映 射 到 自然 数 的 函数 ) 的 全 函数 集合 。 这 些 函 数 的 集合 是 可 数 的 


还 是 不 可 数 的 ? 证 明 你 的 结论 。 


. WH: EH X=Y 定义 的 集合 上 的 二 元 关系 是 成 立 的 ， 当 且 仅 当 card( X) = card( Y) 是 等 价 关系 。 

. 证明 Schróder-Bernstein 定理 。 

. 使 用 操作 数 s 为 N xN 上 的 等 于 关系 构造 递归 定义 。 

. 使 用 后 继 操 作 符 s 为 N x N 的 大 于 关系 构造 递归 定义 。 

- 在 NxN 上 , 为 直线 n=3m 上 的 点 [m,n] 构 成 的 集合 给 出 递归 定义 。 用 s 作为 定义 中 的 操作 符 。 

- 给 出 一 个 点 [m,nj] 的 集合 的 递归 定义 ,要求 这 个 点 位 于 NxN 的 线 n=3m 上 或 在 这 条 直线 的 下 侧 ， 并 


且 在 定义 中 使 用 s 作为 操作 数 。 


. 使 用 操作 数 s 和 加 法 递归 地 定义 自然 数 的 乘法 操作 。 
. 使 用 操作 数 s 递归 地 定义 下 面 的 操作 。 


0, =0 
preden = o a 
自然 数 集合 上 的 减法 定义 为 
Nd n-m, WR n>m 
: = DEUM 
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这 个 操作 称 作 是 真 减 (proper subtraction) 。 使 用 操作 数 s 和 pred 来 递归 地 定义 真 减 。 


36. EA X EARRA. AE X 的 子 集 的 集合 的 递归 定义 ， 并 在 定义 中 使 用 并 操作 。 
“37. 给 出 N 的 有 限 子 集 的 集合 的 递归 定义 ， 并 在 定义 中 使 用 并 和 后 继 so 

38. 证 明 : 对 于 所 有 的 n>0, 都 有 2+5+8+…+(37-1) 2n(3n *1)72, 

39. 证 明 : 对 于 所 有 的 n=0, 都 有 1 +242? +--+ 42" =2""' -1, 

40. 证 明 : 对 于 所 有 的 n>2, AA 1 +2" <3", 

41. W: 对 于 所 有 的 n=0, 3 都 是 ww -n+3 的 因子 。 

42. 已 知 P= 14,B| 是 由 两 个 命题 字母 (布尔 变量 ) 构成 的 。P 上 结构 良好 的 合 取 的 或 析 取 的 布尔 表 
达 式 构成 的 集合 E 由 下 面 的 形式 定义 : 

i) 基础 步 又: A, BeE, 

ii) 递归 步骤 : 如 果 u, veE, 则 (uvyv) sE 并 且 (xAyv) cE, 

ii) 封闭 : 一 个 表达 式 属于 EE 仅 当 从 基础 步骤 开始 经 过 有 限 步 迭代 而 获得 这 个 表达 式 。 

a) 直接 给 出 集合 E, EM BE 上 的 布尔 表达 式 。 

b) 对 E 中 每 个 布尔 表达 式 使 用 数学 归纳 证 明 : 命题 字母 出 现 的 次 数 多 于 操作 数 的 数目 。 对 于 表达 式 u, 
FB n, Cu) o u 中 的 命题 字母 的 数目 ，m(z) 表示 u 中 操作 数 的 数目 。 

c) 使 用 数学 归纳 法 证 明 : 对 于 了 中 的 每 个 布尔 表达 式 ， 左 括号 的 数目 等 于 右 括号 。 

43. 给 出 有 向 图 中 给 定 节点 x 可 通过 某 条 路 径 到 达 的 所 有 节点 的 递归 定义 。 在 这 个 定义 中 可 以 使 用 邻接 关 
系 。 这 个 定义 同时 也 给 出 了 树 的 节点 的 后 代 的 集合 。 x, 

44. 递归 地 定义 树 的 节点 x 的 后 继 的 集合 。 | 

45. 列 出 图 1-6 (a) 的 树 中 的 LEFTOF 关系 的 成 员 。 ra ala ie: Sl 

46. 使 用 下 面 的 树 ， 给 出 (a) Bl (e) ffi. VERI GAS M socie 
a) 树 的 深度 | | D 
b) 2 的 后 继 Xio Xi X2 Xa 
c) xu 和 2 ，xs 和 2 的 最 小 共同 后 继 | 
d) x, EM Xa X15 Xie 
e) 树 的 边界 

47. WH: 有 nn 个 叶子 的 严格 二 又 树 包含 2n -1 个 节点 。 

48. 深度 为 n 的 完全 二 叉 树 (complete binary tree) 也 是 严格 二 叉 树 ， 并 且 1，2，…, n-1 ER 
个 节点 都 是 父 节 点 ， 同 时 nn 层 上 的 节点 也 都 是 叶 结 点 。 证 明 深 度 为 n 的 完全 二 又 树 有 2” -1 个 
T. 

参考 文献 注释 
本 章 介 绍 的 内 容 是 离散 数学 第 一 课 通常 会 涵盖 的 内 容 。 关 于 离散 数学 结构 对 于 计算 机 科学 的 基础 

的 重要 作用 的 全 面 介 绍 ， 可 以 参考 Bobrow 和 Arbib[ 1974] 。 


还 有 其 他 一 些 经 典 书 籍 提 供 了 本 章 介 绍 的 内 容 的 细节 。 集 合 论 的 介绍 可 以 参考 Halmos[ 1974 ] 、 


Stoll[ 1961] 以 及 Fraenkel, Bar-Hillel 和 Levy[ 1984] 。 后 者 首先 给 出 了 在 集合 论 中 产生 的 罗素 悖 论 和 其 

他 悖 论 的 精辟 描述 。 对 角 化 论证 最 早 由 Cantor 在 1874 年 提出 ， 并 在 Cantor[ 1947 ] 中 得 以 重新 介绍 。 

Wilson[1985]. 、Ore[ 1961 ] Bondy 和 Murty[ 1977 | 以 及 Busacker 和 Saaty[ 1965 ] 中 的 内 容 介绍 了 图 论 。 
归纳 、 递 归 和 它们 在 理论 计算 机 科学 中 的 关系 在 Wand[ 1980 ] 中 有 所 介绍 。 


[Ill 
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语言 这 一 概念 包括 大 量 看 上 去 截然 不 同 的 种 类 ， 如 自然 语言 、 计 算 机 语言 和 数学 语言 4 通用 的 
语言 定义 就 要 歧 括 所 有 这 些 类 型 的 语言 。 本 章 我 们 给 出 了 一 个 纯粹 集合 论 意义 上 的 语言 的 定义 : 语 
言 是 字母 表 上 的 字符 串 的 集合 。 字 和 母 表 是 语言 的 符号 的 集合 , 字母 表 上 的 字符 串 是 字母 表 的 符号 的 
有 限 序列 。 

尽管 字符 串 固 有 的 结构 很 简单 ， 但 是 它们 对 于 交流 和 计算 的 重要 作用 却 是 怎么 说 都 不 足 为 过 的 。 
AJF “The sun did not shine” 就 是 由 英语 单词 构成 的 字符 串 。 英 语 的 字母 表 是 单词 和 停顿 符号 的 集合 ， 
它们 都 出 现在 句子 当中 。 数 学 等 式 

p=(nxrxt)/v 
是 由 变量 名 、 运 算 符 和 括号 构成 的 字符 串 。 数 码 照 片 存储 成 由 0 和 1 S FERRO (Bs EE, BN 
有 由 计算 机 存储 和 操作 的 数据 都 可 以 用 位 串 来 表示 。 作 为 计算 机 的 用 户 ， 我 们 经 常 以 文本 字符 串 的 形 
式 向 计算 机 输入 信息 以 及 接收 计算 机 的 输出 。 计 算 机 程序 的 源 代码 是 由 关键 字 、 标 识 符 和 特殊 字符 
(这 些 构 成 了 编程 语言 的 字母 表 ) 组 成 的 文本 字符 串 。 由 于 字符 串 十 分 重要 ， 所 以 我 们 在 本 音 中 首先 
形式 化 地 定义 字符 串 的 表示 ， 并 研究 在 字符 串 上 的 操作 的 性 质 。 

我 们 感 兴趣 的 语言 并 不 是 由 任意 字符 串 构成 的 ， 并 非 所 有 由 英语 字母 构 成 的 字符 串 都 是 句子 ,也 
并 非 源 代 码 的 所 有 字符 串 都 是 合法 的 计算 机 程序 。 语 言 是 由 满足 某 些 特定 需求 以 及 用 于 定义 语言 语法 
的 限制 条 件 的 字符 串 所 组 成 的 。 在 本 章 中 ,我们 将 使 用 递归 定义 和 集合 操作 来 强化 语言 中 字符 串 的 语 
法 限制 。 

同时 ,我 们 也 将 介绍 正则 表达 式 定义 的 语言 族 。 正 则 表达 式 描述 了 一 种 模式 ， 与 这 个 正则 表达 式 
相关 联 的 语言 由 所 有 匹配 这 种 模式 的 字符 串 构 成 。 尽 管 我 们 通过 集合 论 构 造 的 方法 来 介绍 正则 表达 
式 , 但 是 我 们 仍然 可 以 看 出 这 些 语 言 的 出 现 ， 就 像 由 正则 文法 生成 的 以 及 有 限 状 态 自动 机 接收 的 语言 
的 出 现 那样 自然 。 本 章 的 结尾 我 们 将 给 出 正则 表达 式 在 搜索 和 模式 匹配 上 的 应 用 。 


2.1 字符 串 和 语言 


描述 语言 ， 首 先 要 给 出 字母 表 的 标识 和 语言 中 出 现 的 符号 的 集合 。 语 言 的 元 素 是 字母 表 符 号 构成 
的 有 限 长 度 字符 串 。 因 此 ， 研 究 语言 就 需要 理解 产生 和 处 理 字符 串 的 操作 。 在 本 节 中 ， 我 们 将 给 出 字 
母 表 上 的 字符 串 和 基本 字符 串 操作 的 精确 定义 。 

对 字母 表 的 惟一 要 求 就 是 它 包 括 有 限 不 可 分 割 的 对 象 。 自 然 语 言 的 字母 表 ， 像 英语 和 法 语 ， 包 含 
语言 的 单词 和 停顿 标记 。 语 言 字 母 表 中 的 符号 可 以 看 作 是 不 可 分 割 的 对 象 。 单 词 language 不 可 以 划分 
成 lang 和 usage, fiis] format 和 单词 for 与 mat 没有 关系 ， 它 们 都 是 独立 的 。 字 母 表 的 字符 串 就 是 单词 
和 停顿 符号 构成 的 序列 。 你 读 到 的 句子 就 是 这 种 字符 串 。 计 算 机 语言 的 字母 表 包 含 合法 关键 词 、 标 识 
符 和 语言 的 符号 。 这 个 字母 表 上 的 字符 串 就 是 源 代码 的 序列 。 

因为 语言 字母 表 中 的 元 素 都 是 不 可 分 割 的 ， 所 以 我 们 统一 用 单个 字母 来 标识 它们 。 不 带 下 角 标 的 
字母 a, b, c, d, e 用 来 表示 字母 表 中 的 元 素 ， 工 用 来 表示 字母 表 。 字 母 表 上 的 字符 串 用 接近 字母 表 
尾部 的 字母 表示 。 特 别 地 ，p，g，u，v，w，x，y，z 用 来 表示 字符 串 。 自 然 语言 和 计算 机 语言 的 表示 
允许 例外 。 在 这 种 情况 下 ， 字 和 母 表 包 含 特殊 语言 的 不 可 分 割 元 素 。 

可 以 使 用 字母 表 中 元 素 的 序列 来 非 形式 化 地 定义 字符 串 。 为 了 确定 字符 串 的 性 质 ， 字 母 表 的 字符 
串 集合 是 递归 定义 的 。 最 基本 的 字符 串 是 不 包含 任何 元 素 的 字符 串 。 这 个 字符 串 叫 做 空 串 〈null 
string) ， 用 入 表示 。 定 义 中 采用 的 操作 符 主 要 包括 邻接 字母 表 中 的 一 个 元 素 到 已 知 字 符 串 的 右 侧 。 

定义 2.1.1 已 知 卫 是 字母 表 ， 了 "是 吕 上 的 字符 串 的 集合 ， 它 可 以 递归 定义 如 下 : 
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i) 基础 步骤 : NEL. 
i) 递归 步骤 : 如 果 we Hae}, MAwacd*, 
ii) 41H]: we X' 4x Zi 'E p A dai ALTRO Aie m Ro 
MFHANAIES HRY, E'UEGIS£TITE. WREE Sla) MAY 包含 字符 串 入 ,aaa， 
aaa,…。 FFE w 的 长 度 从 直觉 上 讲 是 字符 串 中 元 素 的 数目 ， 而 在 形式 上 则 是 构造 字符 串 的 过 程 中 应 
用 归纳 的 步 数 ， 表 示 成 length (w) AY Ge n^J5X, HA X 中 就 包含 n" 个 长 度 为 的 字符 串 。 
例 2.1.1 已 知 = [a,b,c E PETRAK 
长 度 0: X 
长 度 1: abc 
长 度 2: aa ab ac ba bb bc ca cb cc 
KJE 3: aaa aab aac aba abb abc aca ach acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc Li 
根据 我 们 的 非 形式 化 定义 ， 语 言 包 含 字母 表 上 的 字符 串 。 例 如 ， 英 语 包含 有 单词 构成 的 字符 串 ， 
我 们 称 之 为 句子 。 并 不 是 所 有 的 单词 构成 的 字符 串 都 是 句子 ， 只 有 那些 要 素 单 词 的 顺序 和 类 型 满足 了 
某 个 条 件 的 才 是 。 有 了 描述 正确 句子 形式 的 规则 、 需 求 和 限制 ， 就 可 以 定义 语言 的 语法 了 。 这 些 观察 
的 结果 帮助 我 们 给 出 了 语言 的 形式 化 定义 : 语言 是 包含 字母 表 上 所 有 可 能 的 字符 串 的 集合 的 子 集 。 
定义 2.1.2 字母 表 且 上 的 语言 (language) 是 也" 的 子 集 。 
因为 字符 串 是 语言 的 元 素 ， 所 以 我 们 必须 检查 其 上 的 字符 串 和 操作 符 的 性 质 。 串联 ， 就 是 把 两 个 
字符 串联 在 一 起 ,， 这 是 字符 串 生 成 的 基本 操作 。 串 联 的 形式 化 定义 是 以 串联 的 第 二 个 字符 串 的 长 度 为 
对 象 进行 归纳 的 。 在 这 一 点 上 ， 把 字母 表 上 的 单个 成 员 连 接 到 字符 串 的 最 右 端的 基本 操作 ， 就 是 我 们 
到 目前 为 止 惟一 介绍 过 的 字符 串 上 的 操作 。 因 此 ， 任 何 新 的 操作 都 必须 基于 它 来 定义 。 
定义 2.1.3 已 知 u, ved, ufevH BE (concatenation), 744 uv, 是 "上 的 二 元 操作 ， 定 
义 如 下 ; 
i) 基础 步骤 ; 如 果 ,length(v) 20, AA v=) few =u, 
ii) 递归 步骤 : 已 知 7 是 长 度 length(y) =n>0 的 字符 囊 。 那 么 对 于 任意 长 度 为 n 一 1 的 字符 囊 w 
都 有 VvV=wa， 并 且 如 果 ae X, AA uv = (uw)a。 
例 2.1.2 已 知 w=ab, v=ca 并 且 w=bb。 那 么 
uv = abca vw = cabb 
(uv) w =abcabb u( vw) = abcabb. 加 
u,v 和 w 的 串联 的 结果 与 操作 使 用 的 顺序 无 关 。 从 数学 上 讲 ， 这 个 性 质 叫 做 相关 性 ( associativi- 
ty) 。 定 理 2. 1.4 证 明了 串联 是 相关 二 元 操作 。 
定理 2.1.4 B u, v, wed’, 那么 (Uv)w=u(vw)。 
WEBB: 对 字符 串 w 长 度 的 归纳 。 我 们 使 用 和 字符 串 的 递归 定义 兼容 的 方式 选择 w， 这 种 方式 从 已 
知 字符 串 的 最 右 侧 进行 构造 。 
基础 步骤 : length(w) =0， 那 么 w = 入 ， 并 且 根 据 串 联 的 定义 有 ( 几 )w 2uv, 55—32r Wi, u(vw) = 
u(v) 2uv, 
归纳 假设 : 假设 对 于 所 有 长 度 不 超过 闫 的 字符 串 w SER (uv) w 2 u(vw) . 
归纳 步骤 : 我 们 需要 证 明 对 于 所 有 长 度 为 n+1 ARERR w AP (uv) w 2u(vw) ; 3 w 是 这 样 的 字 
SFB PRAM FRED n FFB x, aed, 都 有 w=xa， FH 
(uv)w = (uv) (xa) (替换 ,w = xa) 
((uv)x)a (串联 定义 ) 
(u( vx) )a (归纳 假设 ) 
=u( (vx)a) (串联 定义 ) 
=u(v(xa) ) (串联 定义 ) 
- u(vw) (替换 ;xa =w). E 
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因为 相关 性 保证 了 无 论 什么 样 的 操作 顺序 都 能 得 到 同样 的 结果 ， 所 以 串联 应 用 中 的 括号 可 以 忽 
略 。 人 们 通常 使 用 指数 来 简化 字符 串 自身 的 串联 。 因 此 ， uu 可 以 写成 忆 ， uuu Bu’, SE, HR 
持 完 整 性 ， 心 表示 字符 串 x 串联 自身 0 次 ， 即 定义 为 空 字符 串 。 串 联 的 操作 是 不 可 交换 的 。 对 于 字符 
$ u=ab, v=ba, uv abba, iij vu = baab。 注 意 忆 =abab， 而 不 是 aabb = a b, 

子 字 符 串 可 以 使 用 串联 来 定义 。 从 直观 上 来 说 ， 如 果 w“ 发 生 在 v 之 内 ”， 那么 4 就 是 v 的 子 字 符 
Po ÉRE, WRF x Aly HB vey, 那么 就 是 v 的 子 字符 束 。 当 x 是 空 串 ， 那么 v 的 
子 字符 串 就 是 v VATA (prefix), Bv=uy, 类似 地 ， 如 果 v=xu， 那么 ww 就 是 的 后 组 (suffix) 。 

字符 串 的 逆 就 是 把 字符 串 从 后 往 前 写 。Abbc Bude cbba, 与 串联 类 似 ， 这 个 一 元 操作 也 是 通过 
字符 串 的 长 度 递归 定义 的 。 从 一 个 字符 串 的 最 右 侧 去 掉 一 个 元 素 形成 一 个 比较 小 的 字符 串 ， 可 以 把 这 
种 方法 用 在 递归 定义 中 。 定 理 2.1.6 构造 了 串联 和 道 操作 的 关系 。 

定义 2.1.5 已 知 UW 是 了 "中 的 一 个 字符 事 ,， usw (reversal) ， 记 成 ， 定 义 如 下 : 

i) 基础 步骤 : 如 果 length(u) 20, AAu=r, JB. A = 入 。 

ii) 递归 步骤 : 如果 length(u) =n>0， 那 么 对 于 菜 个 长 度 为 n--1 的 字符 串 w 和 某 个 ae 品 有 = 

wa 并 且 u" = aw", 

定理 2.1.6 Gru, ved”, PA(w)* »v'u^, 

WEBB: 对 字符 串 v 的 长 度 进行 归纳 证 明 。 

基础 步骤 : 如果 length(v) 20, 那么 v=N， JEH(Quv)" 2 u^, Aw, vu" = Au =u", 

归纳 假设 : 假设 对 于 所 有 长 度 不 超过 nn 的 字符 串 v，(wv)" 2 v"u^, 

归纳 步骤 : 我 们 必须 证 明 ， 对 于 任何 长 度 为 n+1 的 字符 串 v 都 有 (ww)*=vww*。 设 v 是 长 度 为 
n+1 的 字符 串 。 那 么 v=wa， 其 中 w EKEN nee, 并且 ae 了。 按照 归纳 步骤 构造 得 ， 

(uv)* z (u(wa))* 


=((uw)a)" 《串联 的 相关 性 ) 


- a(uw)* ( 逆 的 定义 ) 

=a(w*u") (归纳 假设 ) 

= (aw*)u* (串联 的 相关 性 ) 

= (wa)*u* (3 E XC) 

=u". E 


2.2 语言 的 有 穷 规 格 说 明 


语言 是 由 字母 表 上 的 字符 串 构成 的 集合 。 我 们 感 兴趣 的 语言 不 是 字符 串 的 任意 集合 ， 而 是 那些 满 
足 某 种 语法 要 求 的 字符 串 。 语 言 的 规约 要 求 对 于 语言 的 字符 串 的 描述 没有 二 义 性 。 有 限 语言 可 以 通过 显 
式 地 列举 它 的 元 素来 定义 。 满 足 简 单 语 法 要 求 的 几 种 简单 无 穷 语言 都 是 按照 下 面 的 方式 递归 定义 的 。 

例 2.2.1 字母 表 {a, 外 上 的 字符 串 构成 的 语言 荆 ， 其 中 每 个 字符 串 均 以 a 为 首 且 长 度 为 偶数 ， 其 
定义 如 下 : 

i) 基础 步骤 : aa, abeL, 

i) 递归 步骤 : 如 果 wueL， 那么 uaa, uab, uba, ubbeL, 

ii) HA: 字符 串 weL, 仅 当 它 可 以 由 基础 元 素 经 过 有 限 递归 步骤 构造 而 成 。 
L 中 的 字符 串 是 通过 把 两 个 元 素 添加 到 以 前 构造 的 字符 串 的 最 右 端 构造 而 成 的 。 基 础 保证 工 中 的 每 个 
字符 串 都 是 以 a 为 首 字母 的 。 增 加 长 度 为 2 的 子 字符 串 保 证 了 字符 串 的 长 度 是 偶数 。 nu 

例 2.2.2 字母 表 { aa, 外 上 的 语言 工 定 义 为 

i) 基础 步骤 : A eb; 

i) 递归 步骤 : WR ueL, 那么 Ua, uabeL, 

ii) 封闭 : 字符 串 &eL， 仅 当 它 可 以 由 基础 元 素 经 过 有 限 步 又 构造 而 成 。 
这 个 语言 包含 了 a 后 面 紧 跟着 5 的 所 有 字符 串 。 例如, A, a, abaab AFL, Mibb, bab, abb 不 属 
Ts L1 
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前 面 例子 中 的 归纳 步 又 把 元 素 串 联 到 已 知 字符 串 的 一 端 。 而 把 一 个 字符 串 拆 分 成 子 字符 串 ， 就 是 
在 原 字 符 串 中 的 任何 位 置 增加 元 素 。 这 种 技术 可 以 用 下 面 的 例子 来 解释 。 

例 2.2.3 EAL 是 字母 表 {a,b| 上 的 语言 ， 其 定义 为 

i) RGR: A EL; = 

ii) 递归 步骤 ; 如 果 we 和 可 以 写成 w=xyz， 那么 xaybz eL, 

ii) 封闭 : 字符 串 xeL， 仅 当 它 可 以 由 基础 元 素 使 用 有 限 步骤 构造 而 成 。 
语言 L 包 括 所 有 具有 相同 数目 的 a 和 也 的 字符 串 。 在 归纳 步骤 的 第 一 次 构造 过 程 中 ， 即 xaybze LL, f 
括 下 面 三 个 操作 : 

e 选择 已 经 属于 工 的 字符 串 us : 

© 把 w 划 分 成 子 字符 串 x，y，z， füfRu-xy MA, BULA tH ATE A. 

。 把 a 插入 到 x 和 yy 中 间 , 而 把 5 插入 到 y 和 z 中 间 。 
采取 了 这 些 步 之 后 ， 这 两 个 规则 就 可 以 直观 地 解释 为 “把 一 个 a 和 一 个 5 插入 到 字符 串 w 中 的 任何 
位 置 ”。 口 

递归 定义 提供 了 一 种 定义 语言 字符 串 的 工具 。 例 2.2.1、 例 2. 2. 2 和 例 2. 2. 3 表明 序列 、 位 置 和 
奇偶 这 几 方 面 的 要 求 可 以 通过 字符 串 的 递归 方法 来 生成 。 然 而 ， 这 种 方法 却 不 适用 于 计算 语言 或 自然 
语言 的 复杂 语法 要 求 。 

男 一 种 构造 语言 的 技术 就 是 使 用 集合 操作 ， 由 简单 的 字符 串 集合 构造 字符 串 的 复杂 集合 。 定 义 在 
字符 串 上 的 操作 可 以 被 扩充 到 集合 上 ， 其 至 是 语言 上 。 无穷 语言 的 描述 可 以 使 用 集合 操作 由 有 限 集合 
来 构造 。 下 面 两 个 定义 介绍 了 字符 串 集合 上 的 操作 ， 它 可 以 用 于 语言 定义 和 模式 规约 中 。 

定义 2.2.1 SX FY OBR, IXY, 表示 语言 

XY= {wlueX #HveY}. 
X 与 自身 串联 nn 次 记 成 X"。X 可 以 定义 为 [Alo 
例 2.2.4 EAX -= la,b,c| fll Y 2 (abb,ba| 。 那 和 

XY = | aabb babb ,cabb ,aba, bba, cha} 

X SNN 

X sXsla,b,e| 

X’ = XX = |aa ab ,ac ,ba bb ,bc ,ca ,cb ,cc| 

X’ = X'X = | aaa ,aab ,aac ,aba ,abb ,abc ,aca ,acb ,acc , 
baa ,bab ,bac ,bba ,bbb , bbc ,bca ,bcb , bcc , 
caa , cab ,cac ,cba ,cbb ,cbc ,cca ,ccb ,ccc| . LJ] 

前 面 例子 中 的 集合 看 起 来 很 相似 。 对 于 每 个 i，X' 包 含 例 2.1.1 PAD PREA i ARR 
这 些 观察 结果 形成 了 另 一 个 集合 操作 ， 即 集合 X 的 克 林 (Kleene) E, ipfE X". 使 用 * 操作 ,集合 
上 上 的 字符 串 就 可 以 使 用 串联 和 并 ， 而 不 是 使 用 定义 2.1.1 中 的 基本 操作 来 定义 了 。 

定义 2.2.2 已 知 和 是 集合 。 那 么 


Xt U XX&X = Ux 


RE X 包含 由 X 的 元 素 构 造 的 所 有 字符 串 。 nS X Je No, WAX ME X. EUR EZ 
字符 串 的 集合 。X* 的 另 一 个 定义 是 使 用 串联 和 克 林 星 来 定义 ， 即 六 * = XX" 

形式 语言 的 定义 需要 对 属于 该 语言 的 字符 串 给 出 非 二 义 性 的 说 明 。 非 形式 化 地 定义 语言 会 缺少 准 
确定 义 的 严格 性 。 考 察 |a,b| 上 所 有 包含 子 串 bb 的 字符 串 的 语言 。 这 是 不 是 意味 着 这 种 语言 的 字符 串 
包含 那些 只 出 现 过 一 次 子 串 bb 的 字符 串 ， 或 者 由 多 个 子 字符 串 bb 构成 的 字符 串 是 否 被 这 种 语言 所 允 
Vr? 这 些 问 题 可 以 通过 明确 描述 包含 一 次 出 现 bb, 或 者 至 少 出 现 一 次 的 字符 串 来 回答 。 然 而 ， 这 些 问 
题 总 是 必然 存在 于 自然 语言 提供 的 不 准确 方法 中 的 。 

集合 操作 的 准确 性 可 以 用 于 对 语言 字符 串 的 无 二 义 性 描述 。 例 2. 2. 5 4618 T GLA TER bb 的 字符 串 
的 理论 定义 。 根 据 这 个 定义 ,我 们 可 以 知道 这 种 语言 包含 bb 至 少 出 现 一 次 的 字符 串 。 
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82.2.5 WA L={a,b|" bb] {a,b} BE |a, b) 中 所 有 包含 子 串 bb 的 字符 串 。| bb| 的 串联 ， 其 
中 包含 单 串 bb, PRUE L 中 每 个 字符 串 都 包含 25。 集 合 |a,p 上 允许 在 bb 的 前 面 或 后 面 出 现任 意 数目 的 
4 和 2， 它 们 可 以 按照 任何 顺序 出 现 。 特 别 地 ， 子 串 bb 的 另 一 个 复制 也 可 以 出 在 串联 122} 的 前 面 或 
后 面 。 口 
例 2.2.6 串联 可 以 用 来 描述 字符 串 的 构成 成 分 之 间 的 顺序 。 已 知 L 是 包含 所 有 串 首 为 cx， 串 尾 
为 bb WFR, RE laaj {a,b} “描述 了 前 级 为 aa 的 字符 串 。 类 似 地 ，{a,b}" {bb| 是 所 有 后 缀 为 bb 


的 字符 串 的 集合 。 因 此 L= {aa} la,b]* Ula,b]" {bb}. = 
802.2.7 GAIL, = {bb}, L, | X,bb,bbbb| ERF | b] LIES. iA L A L 都 包含 那些 由 偶 
数 个 5b 构成 的 字符 串 。 注 意 ,， 长度 为 0 的 也 是 属于 LL 和 1; 的 元 素 。 口 


例 2.2.8 RA laa, bb, ab, ba) AERA a,b) 上 偶数 长 度 的 字符 串 。 不 断 使 用 串联 ， 每 次 增加 
两 个 元 素来 构造 新 的 字符 串 。 奇 数 长 度 的 字符 串 的 集合 可 以 定义 为 |a,b}”- aa, bb,ab,ba]"  。 这 个 集 
合 可 以 通过 把 一 个 元 素 串 联 到 一 个 偶数 长 度 的 字符 串 来 获得 。 因 此 ， 奇 数 长 度 的 字符 串 也 可 以 通过 
{aa,bb,ab,ba}* {a,b HEX. El 


2.3 正则 集合 和 表达 式 


在 前 面 的 小 节 中 ， 我 们 根据 已 有 的 语言 使 用 集合 操作 来 构造 新 语言 。 这 些 操作 用 来 保证 某 种 模式 
出 现在 语言 的 字符 串 中 。 在 本 节 中 ， 我 们 将 使 用 构造 语言 的 集合 操作 方法 ， 但 是 会 限制 那些 构造 过 程 
中 使 用 的 集合 和 操作 。 

空 集 ， 由 空 串 构成 的 集合 ， 以 及 使 用 并 、 串 联 和 克 林 星 操作 构成 的 字符 串 的 集合 都 是 正则 的 
(regular) 。 定 义 2.3. 1 中 递归 定义 的 正则 集合 ， 包 含 一 族 语 言 。 这 族 语 言 在 形式 语言 、 模 式 识 别 和 有 
限 状 态 机 理论 中 都 扮演 着 重要 的 角色 。 l 

定义 2.3.1 CHFHAL, MALEMEMBEA (fuzzy sets) 递归 定义 为 

i) 基础 步骤 : 对 于 任意 的 ae L, Ø, [N pla 都 是 有 上 的 正则 集合 。 

i) 递归 步骤 : 已 知 X 和 立 都 是 并 上 的 正则 集合 。 那 么 集合 

XUY 

XY 

ie 
AR Y bem A, 

ii) 封闭 : 和 是 屋 上 的 正则 集合 ， 仅 当 它 可 以 由 基础 元 素 由 有 限 步 递归 定义 生成 。 

如 果 一 种 语言 可 以 用 一 个 正则 集合 来 定义 ， 那 么 这 种 语言 就 是 正则 的 (regular)。 下 面 的 例子 给 
出 了 如 何 用 正则 集合 来 描述 语言 的 字符 串 。 

例 2.3.1 例 2.2.5 中 的 语言 ， 即 包含 子 串 bb 的 字符 串 的 集合 ， 是 这 个 集合 是 1a,b| 上 的 正则 集 
合 。 根 据 定义 的 基础 ，|a| 和 |b| 都 是 正则 集合 。4a} Mib) 的 并 以 及 克 林 星 操作 的 结果 都 是 |a,b}"， 这 
也 就 是 1a,b|} 上 的 所 有 字符 串 构 成 的 集合 。 使 用 串联 后 ，124 ib] = bb] 就 是 正则 的 。 两 次 应 用 串联 就 
可 以 得 到 |a,b}* | bb} {a,b}*。 口 

例 2.3.2 以 a 为 首 字 母 和 尾 字母 ,并 且 至 少 有 一 个 b 的 字符 串 的 集合 ， 是 |a,b} 上 的 正则 集合 。 
这 个 集合 上 的 字符 串 可 以 直观 地 描述 为 “以 a 为首， 跟着 任意 字符 串 ， 然 后 是 5， 接 着 又 是 任意 字符 
$, waa.” PE 

{a} la,b]* {b} {a,b}" {a} 
展示 了 集合 的 正则 性 。 口 
根据 定义 ， 正 则 集合 是 那些 可 以 通过 空 集 构造 的 集合 ， 包 含 空 串 的 集合 ， 以 及 对 字母 表 上 的 单一 
元 素 进行 并 、 串 联 和 克 林 星 操作 而 获得 的 集合 。 正 则 表达 式 可 以 用 来 简化 正则 集合 的 表示 。 正 则 集合 
多 ，| 和 | 和 |al 使 用 多 ,入 和 a 来 表示 ， 而 不 需要 集合 括号 | 1。 集合 操作 并 、 克 林 星 和 串联 分 别 使 用 
U 、 和 并 列 来 表示 。 圆 括号 用 来 表示 操作 的 顺序 。 
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定义 2.3.2 已 知 字 母 表 。 上 的 正则 表达 式 (regular expresssions) 递归 定义 如 下 : 
i) 基础 步骤 : 对 于 任意 的 CE， 乡 ,， 入 和 au 都 是 了 上 的 正则 表达 式 。 
ii) 递归 步骤 : 已 知 & 和 ?都 是 并 上 的 正则 表达 式 。 那 么 表达 式 , 
(uUv) 
(uv) 
(u^) 
AUR Y ES EM AGE X, 
ii) 封闭 : 到 是 之 上 的 正则 表达 式 ,| 仅 当 它 可 以 由 基础 元 素 由 有 限 步 递归 定义 生成 。 
因为 并 和 串联 是 类 似 的 ， 所 以 在 表示 一 系列 这 些 操 作 的 序列 的 时 候 ， 圆 括号 是 可 以 省 略 的 。 为 了 
进一步 减少 圆 括号 的 数目 ， 这 些 操 作 被 赋予 了 一 定 的 优先 级 。 克 林 星 的 优先 级 最 高 ， 紧 接着 是 并 和 串 
联 。 应 用 这 些 规则 , Bil 2.3.1 和 例 2. 3. 2 中 的 集合 对 应 的 正则 表达 式 是 (aUb)*bb(aUb)* 和 a(aUb) 
"b(aUb)' a, u' 表示 表达 式 uu 的 缩写 。 类 似 的 ，w? 表示 正则 表达 式 uu, wi 表示 wu, AE, 
例 2.3.3 定义 在 |a,b| 上 的 集合 |bawab |we [a,b] “| 是 正则 的 。 下 面 的 表格 给 出 了 正则 集合 的 
递归 生成 步骤 ， 以 及 相应 语言 的 正则 表达 式 定义 。 表 中 右边 一 列 给 出 了 在 递归 操作 中 使 用 的 每 个 构成 
成 分 是 正则 的 理由 。 











& ê 表 达 xX 理 ,'| (由 
1. lal a 基础 
2. |b} b 基础 
3. {a} {b} = | ab] ab 1,.2,. HX 
4. lal U lb] s {a,b} aUb 1,2, 并 
5. |b} la] = | ba} ba 2, 1, BR 
6. |a,bl* (aUb) * 4, Kleene Œ 
7. {bat la,b]* ba(aUb)* 5, 6, -串联 
8. | ba} la,b|* | ab} ba(aUb) * ab 7, 9, HK 口 


前 面 的 这 个 例子 揭示 了 正则 集合 和 正则 表达 式 是 如 何 从 基本 正则 集合 演化 而 来 的 。 每 个 正则 集合 
都 可 以 通过 例 2. 3. 3 给 出 的 类 似 的 操作 的 有 限 步 分 解 来 获得 。 

正则 表达 式 定 义 了 一 种 模式 ， 于 是 ， 仅 当 字 符 串 匹 配 该 模式 时 ， 这 个 字符 串 才 属 于 这 个 正则 表达 
式 表 示 的 语言 。 串 联 指 定 了 顺序 ， 字 符 串 w 属于 ur 仅 当 它 包含 &， 并 且 z 后 面 紧 跟着 的 就 是 v 的 字符 
tB, Kleene 星人 允许 重复 和 LU 选择 。 例 2. 3. 3 中 的 正则 表达 式 给 出 的 模式 ， 需 要 字符 串 的 首 是 ze， 而 尾 
是 ab， 在 这 个 前 级 和 后 级 间 的 是 a M b 的 任意 组 合 。 接 下 来 的 例子 进一步 解释 了 正则 表达 式 描述 模式 
的 能 力 。 

例 2.3.4 正则 表达 式 (aUb) 'aa(aUb)  fl(aUb) ' bb(aUb) 分别 表示 包含 aa 和 bb 的 字符 
串 。 使 用 U 操 作 把 这 两 个 表达 式 结合 起 来 ， 会 得 到 表达 式 (aUb) 'aa(aUb)* U(aUb)'bb(aUb)', 
这 个 表达 式 表 示 的 是 |a,b| 上 包含 子 串 aa 或 bb 的 所 有 字符 串 的 集合 。 口 

例 2.3.5 |a,b| 上 只 包含 两 个 b 的 字符 串 的 集合 对 应 的 正则 表达 式 ， 必 须 保证 两 个 5 的 存在 。b 
的 前 面 、 中 间 和 后 面 可 以 包含 任意 数目 的 a。 连接 那些 满足 要 求 的 子 表 达 式 可 以 得 到 a’ba*ba* 。 O 

例 2.3.6 正则 表达 式 

i) a' ba^ b(aUb)* 

ii) (a Ub) ' ba' ba* 

iii) (aUb) 'b(aUb) 'b(aUb)* 
EXT la,b] 上 包含 至 少 两 个 b 的 字符 串 的 集合 。 正 如 例 2.3.5 所 示 ， 至 少 两 个 5b 的 存在 是 通过 串联 
两 个 表达 式 b 来 保证 的 。 E| 

例 2.3.7 ZAMIRA a'(a'ba' ba* )* 定义 的 正则 集合 。 表 达 式 中 圆 括 号 里 面 的 就 是 例 
2.3.5 中 只 含有 两 个 5 的 正则 表达 式 。 克 林 星 构造 了 任意 数目 的 这 样 的 字符 串 的 串联 。 结 果 是 空 串 
(没有 重复 任何 模式 ) 和 包含 正 偶数 b 的 所 有 字符 串 。 只 包含 一 个 a 的 字符 串 不 属于 (a’ba’ ba^ )* , 


23 iz € 27 








在 表达 式 的 开始 串联 a ， 就 生成 了 具有 偶数 b IET B. xT ESSA ix at (ba* 
ba')', E 

12.3.8 使 用 可 共享 的 子 串 使 得 正则 表达 式 一 一 首 字母 为 ha， 尾 字 母 是 ab， 并且 包含 子 串 
达 式 ba(a Ub) ' aa(a Ub) ' ab 中 明确 插入 了 这 三 个 构成 成 分 。 每 个 字符 
串 都 必须 包含 至 少 四 个 a。 但 是 ， 字 符 串 baab 满足 上 述 条 件 ， 可 是 它 只 有 两 个 a。 这 种 语言 的 正则 表 
达 式 是 











ba(aUb) *aa(aUb) * ab 
U baa(aUb) ab 
U ba(aUb) ' aab 
U baab. i E 
正则 表达 式 的 构造 过 程 是 正 向 的 ， 使 用 串联 、 并 ， 或 者 Kleene 星 操作 可 以 在 表达 式 中 明确 地 插入 
一 些 具 有 期 望 特点 的 表达 式 。 这 里 不 存在 逆向 操作 ， 比 如 省 略 那些 具有 特殊 性 质 的 字符 串 。 为 了 由 没 
有 性 质 的 字符 串 集合 来 构造 正则 表达 式 ， 必 须 首先 正 向 地 表示 语言 的 构造 条 件 ， 然 后 再 形式 化 地 构造 
正则 表达 式 。 下 面 这 两 个 例子 就 是 解释 这 个 方法 的 。 

例 2.3.9 ATA {a,b} EAL aaa 结尾 的 字符 串 集合 构造 正则 表达 式 ， 我 们 必须 保证 aaa 不 是 所 
描述 的 表达 式 的 任意 字符 串 后 缀 。 带 有 “的 字符 串 的 可 能 结尾 包括 bp，ba 或 者 baa。 正 则 表达 式 的 第 
一 部 分 

(aUb) ' (bUbaUbaa) U NUa Uaa 

就 定义 了 这 些 字符 串 。 最 后 的 三 个 表达 式 表示 了 长 度 为 0、1 和 不 包含 b 的 长 度 为 2 的 字符 串 的 特 
殊 例子 。 口 

例 2.3.10 使 用 c"(bUac*) “定义 的 语言 LL 包含 la, b, cl 上 的 所 有 不 包含 子 串 be 的 字符 串 。 
外 部 的 c” 和 括号 里 的 ac * 使 得 任意 数目 的 a 和 c 都 可 以 按照 任何 顺序 出 现 。b 后 面 可 以 紧 跟着 一 个 b, 
或 是 ac* 。 在 ac "首部 的 a 直接 阻挡 了 接 下 来 的 c。 为 了 更 好 地 理解 表达 式 表示 的 集合 ， 我 们 要 试图 说 
HH acabacc 和 bbaaacc 属于 c ” (bUac* ) “表示 的 集合 口 

例 2.3.6 和 例 2. 3. 7 证 明了 语言 的 正则 表达 式 的 定义 不 是 惟一 的 。 表 示 同 一 集合 的 两 个 表达 式 是 
等 价 的 〈eqivalent) 。 代 数 演化 正则 表达 式 使 用 表 2-1 中 的 实体 来 构造 等 价 关 系 。 这 些 实体 是 正则 表达 
式 的 并 、 串 联 和 Kleene 星 操作 的 性 质 。 


表 2-1 正则 表达 式 恒等式 


1. Øu -uO = Ø 9.u(vUw) =uvUuw 

2. Mu =U\ =U 10. (uUv)w uw Uvw 

3.0' =r 11. (uv) 'u =u(vu)* 

AA = 入 12: (uv) = (Ge Uv)" 

5.uUv=vUu -u'(uUv)' =(uUvu* )* 
6.uU@=u SUV) Se CVE e) 
7.uUu =u nu yy m 


ns (ny 


等 式 5 体现 了 集合 并 的 交换 性 。 等 式 9 和 等 式 10 是 把 并 和 串联 的 分 配 律 用 正则 表达 式 来 表示 。 表 
达 式 的 最 终 集合 提供 了 由 元 素 & 和 v 构造 的 所 有 字符 串 的 一 定数 量 的 等 价 表示 。 表 2-1 可 以 用 来 建立 
或 简化 正则 表达 式 的 等 价 关 系 。 

例 2.3.11 构造 {a,bl 上 不 包含 子 串 aa 的 字符 串 的 集合 所 对 应 的 正则 表达 式 。 这 个 集合 中 的 字符 
串 可 能 包含 任意 数目 的 5 作为 前 级 。 所 有 的 a 后 面 都 紧 跟 着 至 少 一 个 b, 或 者 字符 串 在 此 处 结束 。 正 
则 表达 式 b" (ab* )” Ub" (ab* ) “a 生成 的 集合 可 以 分 割 成 两 个 不 相交 的 子 集 合 。 第 一 部 分 包括 以 5 结 





[53] 





[55] 
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尾 的 字符 串 ， 第 二 部 分 包括 以 4 结尾 的 字符 串 。 使 用 表 2-1 中 的 恒等式 化 简 这 个 表达 式 可 以 得 到 
b* (ab*)* Ub' (ab')'a 
zb'(ab*)' (AUa) 
=b" (abb* ) (AUa) 
-(bUab)'(AUa). . 口 
正则 表达 式 可 以 用 来 描述 很 多 复杂 的 模式 ， 但 是 值得 注意 的 是 ， 仍 然 有 很 多 语言 是 无 法 用 任何 正 
则 表达 式 来 定义 的 。 在 第 6 章 ， 我 们 将 看 到 正则 表达 式 无 法 定义 语言 1c | i20]. 


2.4 正则 表达 式 和 文本 搜索 


对 于 大 多 数 的 计算 机 用 户 而 言 ， 正 则 表达 式 的 一 个 常见 应 用 是 搜索 文档 和 文件 。 在 本 节 中 ， 我 们 
将 给 出 正则 表达 式 在 文本 搜索 中 的 两 类 应 用 。 

使 用 正则 表达 式 定义 语言 与 用 其 进行 文本 搜索 的 主要 区 别 就 是 期 望 匹配 的 区 域 。 如 果 整 个 字符 串 
与 正则 表达 式 所 描述 的 模式 相 匹配 ， 那 么 这 个 字符 串 就 属于 该 正则 表达 式 定义 的 语言 。 例 如 ， 字 符 串 
匹配 ab 仅 当 它 开 头 是 a， 紧 跟着 一 个 或 多 个 b。 

在 文本 搜索 中 ,我 们 在 文本 中 寻找 符合 预期 模式 的 子 串 。 因 此 ， 单 词 

about 
abbot 
rehabilitate 
tabulate 
abominable 
可 以 看 成 是 匹配 模式 ab* 的 。 BSC, abominable 两 次 匹配 这 个 模式 。 

于 是 ， 就 产生 了 两 种 不 同类 型 的 文本 匹配 ， 它 们 分 别称 为 离线 搜索 和 在 线 搜索 。 离 线 搜索 指 的 
E, 一 个 搜索 程序 在 运行 ， 程 序 的 输入 是 模式 和 文件 ， 输 出 包括 匹配 模式 的 行 或 文档 。 离 线 搜索 常常 
是 使 用 操作 系统 设备 或 者 使 用 专门 为 搜索 设计 的 语言 编写 的 程序 。GREP 和 awk 就 是 文档 搜索 的 例 
F, mi Perl 则 是 用 于 文件 搜索 的 编程 语言 。 我 们 将 使 用 GREP (Global search for Regular Expresssion 
and Print) 的 首 子 母 缩写 一 一 来 解释 这 种 类 型 的 正则 表达 式 搜 索 。 

文本 浏览 器 、 文 本 编辑 器 和 文字 处 理 系 统 都 提供 了 在 线 搜索 工具 。 在 线 搜索 的 目的 是 为 了 交互 式 
地 发 现 第 一 个 、 下 一 个 ， 进 而 发 现 所 有 的 匹配 搜索 模式 的 子 串 。 微 软 Word 中 的 “发 现 ” 命 令 可 以 用 
于 展示 在 线 和 离线 模式 匹配 的 区 别 。 

因为 期 望 模式 通常 是 使 用 键盘 输入 的 ， 所 以 搜索 设备 使 用 的 正则 表达 式 表示 通常 都 很 简练 ， 而 且 
不 包含 上 角 标 。 尽 管 在 搜索 应 用 中 使 用 正则 表达 式 没 有 固定 的 语法 ， 但 是 大 部 分 应 用 使 用 的 表示 还 是 
有 很 多 共性 的 。 我 们 将 使 用 GREP 的 扩展 正则 表达 式 表示 法 来 解释 文本 搜索 中 的 模式 描述 。 

文件 或 文档 的 字母 表 经 常 包括 ASCI 字 符 表 ， 人 参见 附录 焉 。 它 所 包含 的 元 素数 量 是 我 们 在 正则 表 
达 式 中 使 用 的 字母 表 的 两 倍 或 三 倍 。 使 用 字母 表 | a,b} ， 任 何 字 符 串 的 正则 表达 式 都 属于 (aUb)*。 
使 用 这 种 形式 的 任何 ASCI 字 符 串 的 表达 式 都 需要 写 几 行 ， 因 此 使 用 键盘 输入 十 分 不 方便 。 我 们 将 介 
绍 两 种 表示 习惯 一 一 括号 表达 式 和 范围 表达 式 ， 从 而 简化 模式 匹配 在 扩展 字母 表 上 的 描述 。 

括号 表示 [ ] 用 来 表示 字母 表 字符 的 并 。 例 如 ，[ abcd ] 用 来 表示 表达 式 (aUbUcUd)。 在 左边 括 
号 的 后 面 加 一 个 “ 符号， 就 产生 了 并 的 补 。 因 此 ，[“abcd] 表 示 所 有 除 a,， b,c 和 4d 以 外 的 字符 。 

范围 表达 式 使 用 ASCI 码 序列 来 描述 字符 的 序列 。 例 如 ，A —Z 是 表示 所 有 大 写字 和 母 的 范围 表达 
式 。 在 ASCI[ 表 中 这 些 是 编码 从 65 到 90 的 字符 。 范 围 表 达 式 可 以 使 用 括号 表达 式 作 为 参数 。 
[a -zA -Z0 -9] 表 示 所 有 字母 和 数字 的 集合 。 另 外 ， 某 种 经 常 出 现 的 字符 的 子 集 可 以 使 用 它们 的 记 
忆 单 元 标识 符 。 例 如 ，[ :digit: ] ，[ :alpha: ] 和 [ :alnum:] 是 [0 -9], [a-zA - Z/UJX[a —zA —- AO -9] 
的 缩写 。 扩 展 的 正则 表达 式 表示 也 包含 了 用 于 表示 匹配 的 单词 头 和 尾 的 符号 \< 和 \>。 

除了 标准 操作 U 、 串 联 和 * 之 外 ，GREP 的 扩展 正则 表达 式 表 示 还 包含 表达 式 上 的 其 他 操作 。 这 
些 操 作 虽然 没有 扩展 表述 的 模式 类 型 ， 但 是 它们 简化 了 模式 的 表示 。 表 2-2 给 出 了 扩展 表达 式 操作 的 











表示 。 优 先 级 和 括号 进一步 定义 了 操作 的 范围 。 
表 2-2 扩展 的 正则 表达 式 操作 








操作 符号 例子 正则 表达 式 

连接 ab ab 
[a-c][ AB] aA UaB UbA UbBUcA UcB 

Kleene Æ : * [ab]* (aUb) * 
分 离 | [ab]* | A (aUb) * UA 
0 或 多 个 * [ab] + (aUb) * 
0 或 1 个 ? a? (aU X) 
一 个 字符 aa alaUb)a if¥=|a,b 
n 次 [n] a{4} aaaa =a‘ 
n 或 多 次 {n,| a{4,} aaaaa * 
n 到 mm 次 {n,m} a|4,6] aaaa U aaaaa U aaaaaa 


GREP 的 输入 是 模式 和 待 搜索 的 文件 。GREP 在 文件 中 进行 逐 行 搜索 。 如 果 某 行 包括 匹 配 模式 的 
子 串 ， 那 么 这 行 就 被 打印 出 来 ， 然 后 继续 对 下 面 的 行进 行 搜索 。 为 了 使 用 扩展 的 正则 表达 式 进 行 模式 
匹配 ,我 们 将 在 莎士比亚 的 《凯撒 大 帝 》 第 二 场 第 二 幕 中 搜索 凯撒 对 他 妻子 评价 。 

Cowards die many times before their deaths; 

The valiant never taste of death but once. 

Of all the wonders that I yet have heard. 

It seems to me most strange that men should fear; 

Seeing that death, a necessary end, 

Will come when it will come. 7 

我 们 首先 寻找 匹配 模式 m[a-z]n 的 。 这 就 是 寻找 长 度 为 3， 包含 m 和 n， 并 且 它 们 中 间 是 任何 
一 个 小 写字 母 的 字符 串 。 搜 索 的 结果 是 

C: »grep-E "m[a-z]n" caesar 

Cowards die many times before their deaths; 

It seems to me most strange that men should fear; 

GREP 中 的 -E 选项 是 描述 模式 的 扩展 正则 表达 式 表 示 法 ， 而 引号 则 描绘 了 模式 。many 中 的 子 串 man 
和 单词 men 匹配 了 这 个 模式 ， 因 此 包含 这 些 字 符 串 的 行 被 打印 了 出 来 。 

现在 搜索 变 成 了 寻找 m Al n 之 间 被 任何 小 写字 母 或 空 字符 分 割 的 出 现 。 

C: >grep-E "m[a-z] *n" caesar 

Cowards die many times before their deaths; 

It seems to me most strange that men should fear; 

Will come when it will come. 
输出 部 分 增加 了 最 后 一 行 ， 这 是 因为 这 行 的 me 和 when 与 模式 相 匹配 。 模 式 m[a - z] *n 在 下 面 这 行 
得 到 了 六 次 匹配 : 

It seems to me most strange that men should fear; 
然而 ，GREP 不 需要 找到 所 有 的 匹配 ， 每 行 中 找到 一 个 就 可 以 把 对 应 的 行 输出 。 

扩展 正则 表达 式 表 示 法 可 以 用 来 描绘 文本 中 更 加 复杂 的 模式 。 考 虑 在 文本 文件 中 寻找 包含 人 名 的 
行 。 为 了 确定 名 字 的 形式 ,我 们 首先 考虑 所 有 作为 名 字 部 分 组 成 的 可 能 字符 串 。 

i) 第 一 个 名 字 或 者 初始 名 : [A-Z] [a-z] +| [A-2][.] 

ii) 中 间 名 字 ， 初 始 名 , 或 者 两 者 都 不 是 : ( [A-Z][a-z]+| [A-2Z][.])? 

ii) 姓 : [A-Z] [a-z] + 

出 现在 第 一 个 位 置 上 的 字符 串 或 者 是 名 字 或 者 是 初始 名 字 。 如 果 前 者 的 话 ， 那 么 字符 串 的 首 字母 
应 该 是 大 写 的 ， 紧 接着 的 是 由 小 写 的 字母 构成 的 字符 串 。 初 始 名 字 仅 仅 就 是 一 个 大 写字 母 ， 然 后 紧 跟 
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着 一 个 名 点。 同样 的 表达 式 可 以 用 于 中 间 名 字 或 姓 。 间 号 “?” 表 示 没 有 中 间 名 字 , 或 者 是 需要 初始 
名 字 。 这 些 表达 式 都 可 以 用 下 面 显示 的 空格 来 连接 。 

(I[A=2Z] [a-z] + II[A3-Z][.1) O (([(A -Z] [a -z] + (A -Z1 [.1) 01)? ([A-Z] [a -z] +) 
就 是 一 个 通用 的 匹配 名 字 的 模式 。 

接 下 来 的 表达 式 将 匹配 E. B. White, Edgar Allen Poe 和 Alan Turing。 因 为 模式 匹配 是 严格 限制 于 
字符 串 形式 的 ， 并 没有 潜在 意义 的 ( 即 : 模式 匹配 检查 语法 ， 但 不 检查 语义 ) ， 因 此 表达 式 也 匹配 
Buckingham Palace 和 U. S. Mail。 而 且 ， 模 式 不 匹配 Vincent van Gogh, Dr. Watson 或 者 Aristotle, Jg T 
匹配 名 字 的 这 些 变化 ， 还 需要 增加 其 他 的 条 件 。 

与 离线 分 析 不 同 ， 网 页 浏览 和 文字 处 理 中 的 搜索 命令 ， 是 以 交互 式 的 方式 来 发 现 匹 配 输 入 模式 的 
字符 串 的 。 子 串 匹 配 一 个 模式 可 以 分 布 到 很 多 行 。 使 用 微软 Word 中 的 “寻找 ”命令 来 匹配 模式 m * 
n， 就 是 寻找 首 字 母 是 m， 尾 字母 是 n 的 子 串 ,在 m 和 na 之 间 可 以 是 任何 字符 串 。 搜 索 的 结果 将 是 发 
现 并 强调 匹配 该 模式 的 第 一 个 子 串 的 之 前 的 位 置 或 是 之 后 的 位 置 。 重 复 点 击 “ 下 一 个 ”将 会 继续 搜 
索 ， 并 会 突出 模式 的 下 一 个 匹配 。 在 凯撒 中 匹配 m * n 的 子 串 如 下 ， 其 中 ， 匹 配 的 子 串 会 突出 显示 。 

Cowards die many times before their deaths; 

Cowards die many times before their deaths; 

The valiant never taste of death but once. 

It seems to me most strange that men should fear; 

It seems to me most strange that men should fear; 

It seems to me most strange that men should fear; 

It seems to me most strange that men should fear; 

Will come when it will come. : 

请 注意 ， 并 不 是 所 有 匹配 的 子 串 都 会 被 突出 显示 。 模 式 m * n 匹配 所 有 满足 下 面条 件 的 字符 串 : 
首 字母 是 m， 并 且 子 串 后 面 出 现 n。 这 个 搜索 只 强调 文件 中 每 个 m 的 第 一 次 匹配 出 现 。 

在 第 6 章 中 我 们 将 看 到 正则 表达 式 可 以 转化 成 有 限 状 态 机 。 通 过 这 个 机 器 的 计算 过 程 ， 就 可 以 找 
到 匹配 该 表达 式 描述 的 模式 的 字符 串 或 子 串 。 使 用 正则 表达 式 的 操作 限制 一 交 和 集合 差 是 不 允许 
的 一 一 使 得 把 模式 的 描述 转化 成 搜索 算法 的 实现 的 过 程 更 容易 了 。 


2.5. 练习 


. 给 出 二 上 的 字符 串 的 长 度 的 递归 定义 。 使 用 字符 串 定义 中 的 主要 操作 。 
. 对 i 进行 递归 ， 证 明 对 于 任意 w 和 所 有 i20, Sp Ow)! = (w')"。 
. 对 字符 串 的 长 度 进行 递归 ， 证 明 对 于 所 有 的 字符 串 we L’, WAM)" =w. 
. 已 知 X= (aa,bb| fll Y 2 | A, b,ab] , 
a) 列 出 集合 XY 中 的 字符 串 。 
b) X -中 有 多 少 个 字符 串 的 长 度 是 6? 
c) 列 出 集合 立 " 中 长 度 不 超过 3 的 字符 串 。 
d) 列 出 X"Y -中 长 度 不 超过 4 的 字符 串 。 
5. GAIL Jéla,b] 上 通过 归纳 定义 的 字符 串 的 集合 。 
i) 基础 步骤 : beL, 
ii) 递归 步骤 : WE uA L, AA ubeL,uabeL,ubaeL Jf B bua eL, 
ii) 封闭 : 字符 串 v 属于 工 仅 当 它 可 以 由 基础 通过 有 限 步 归纳 而 成 。 
a) 列 出 集合 Lu ，L 和 LILK 
b) FFE bbaaba RF LG? 如 果 是 ， 它 是 如 何 产生 的 。 如 果 不 是 ， 解 释 原 因 。 
c) 字符 串 bbaaaabb JAF LG? 如 果 是 ， 它 是 如 何 产生 的 。 如 果 不 是 ， 解 释 原 因 。 
6. Ah la, b) 上 包含 至 少 一 个 bp， 并 且 在 第 一 个 5b 之 前 有 偶数 个 a 的 字符 串 的 集合 的 定义 。 例 如 ,，bab，aab 
和 aaaabababab 属于 这 个 集合 ， 可 是 aa, abb 就 不 是 。 
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7. 给 出 集合 |a'b | 0 和 is<j 和 2 计 的 递归 定义 。 
8. AH {a,b} 上 a 的 个 数 是 b 的 两 倍 的 字符 串 的 集合 的 递归 定义 。 
9. HEPA: 例 2.2.1 中 定义 的 语言 的 每 个 字符 串 的 长 度 都 是 偶数 。 可 以 依据 对 字符 串 的 递归 构造 过 程 来 进行 
归纳 证 明 。 
10. HERA: 例 2.2.2 中 定义 的 语言 的 每 个 字符 串 中 a 的 个 数 都 不 少 于 b。 已 知 n。(u) 表 示 字 符 串 中 a 的 个 数 ， 
n, (u) dean uP b 的 个 数 。 归 纳 证 明 应 该 建立 不 等 关系 n, (u) Sn, (u) o 
11. BALL {a,b} EXSIHAE A: 
i) 基础 步骤 : 入 eL。 
i) 递归 步骤 : 如 果 xeL， 那 么 aaub eL. 
ii) 封闭 : FRB w 属于 L， 仅 当 它 可 以 由 基础 使 用 有 限 步 递归 步骤 构造 而 成 。 
a) 给 出 使 用 递归 定义 的 集合 Ly, L, 和 Eso 
b) 给 出 使 用 递归 定义 的 字符 串 集合 的 固有 定义 。 
c) 使 用 数学 推导 证 明 每 个 字符 串 u 都 属于 工 ， 要 求 字符 串 中 a 的 个 数 是 5b 的 个 数 的 二 倍 。 已 知 n (u) 
All u, (uU) RIR uP a 的 个 数 和 4b， 的 个 数 。 
*12. REY EAH (palindrome) 指 的 是 : 爱 * 从 前 往 后 与 从 后 向 前 拼写 完全 相同 的 字符 串 。 上 的 回 
文 构成 的 集合 ， 可 以 通过 下 面 的 递归 来 定义 : 
i) 基础 步骤 : 对 于 所 有 的 ae L, d 和 a 都 是 回 文 。 
ii) 递归 步骤 : 如果 w 是 回 文 ,， 并 且 ae X, WA awa 是 回 文 。 
ii) 封闭 : w 是 回 文 ， 仅 当 它 可 以 由 基础 元 素 使 用 有 限 步 递 归 而 获得 。 
回 文 的 集合 可 以 定义 为 {fw| w = ws} 。 证 明 这 两 个 定义 产生 的 是 同一 个 集合 。 
13. 已 知 L 2 [aaa] * , L, 2 1a,b] {a,b} {a,b} a,b] VUE L, =L. HRA L, LAL, NOL, 中 的 字符 
FB 
从 练习 14 到 38 ， 给 出 描述 下 面 集合 的 正则 表达 式 。 
14. ja b,c) 上 的 字符 串 的 集合 ， 要 求 所 有 的 a 在 b 的 前 面 , b 在 c 的 前 面 。 当 然 也 有 可 能 没有 a, 没有 4b 或 
者 没有 c. 
15. HRY 14 中 的 集合 ， 但 是 不 包括 空 串 。 
16. la,b,c| 上 长 度 为 3 的 字符 串 的 集合 。 
17. la,b,c| 上 长 度 小 于 3 的 字符 串 的 集合 。 
18. |a,p,cl 上 长 度 大 于 3 的 字符 串 的 集合 。 
19. {a,b} EBETE ab， 并 且 长 度 大 于 2 的 字符 串 的 集合 。 
20. {a,b} 上 长 度 不 小 于 2， 并 且 所 有 的 a 都 在 b 的 前 面 的 字符 串 的 集合 。 
21. {a,b} 上 包含 子 串 aa 和 bb 的 字符 串 的 集合 。 
22. la,b| EFE aa 出 现 至 少 两 次 的 字符 串 的 集合 。 提 示 : 注意 子 串 aaa, 
23. (a,b, c) 上 开始 字母 为 a， 准 确 包 含 两 个 bp， 并 且 以 cc 结尾 的 字符 串 的 集合 。 
*24. [a,b] 上 包含 子 串 ab 和 子 串 ba 的 字符 串 的 集合 。 
25. la,b,cl} 上 每 个 b 后 面 紧 跟着 至 少 一 个 c 的 字符 串 的 集合 。 
26. {a,b} 上 a 的 数目 可 以 被 3 整除 的 字符 串 的 集合 。 
27. la,b,c| 上 Alc 的 总 数 是 3 的 字符 串 的 集合 。 
*28. |a, b| 上 每 个 a 的 前 面 就 是 bp， 后 者 后 面 紧 跟着 5 的 字符 串 的 集合 。 比 如 ，baab，aba Ñ b, 
29. la,b,c| 上 不 包含 子 串 aa 的 字符 串 的 集合 。 
30. la,b| 上 不 是 以 aaa 为 首 的 字符 串 的 集合 。 
31. [a,b] 上 不 包含 子 串 aaa 的 字符 串 的 集合 。 
“32. {a,b} 上 不 包含 子 串 aba 的 字符 串 的 集合 。 
33. la,b| EFE aa 只 出 现 一 次 的 字符 串 的 集合 。 
34. |a, b) 上 长 度 为 奇数 ， 并 且 包 含 字符 串 bb 的 字符 串 的 集合 。 
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35. 
36. 
37. 
"38. 
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40. 


41. 





|a,b,c| 上 长 度 为 偶数 ， 并 且 一 定 包含 一 个 a 的 字符 串 的 集合 。 

1a,b| 上 长度 为 奇数 ， 并 且 一 定 只 包含 两 个 5 的 字符 串 的 集合 。 

[a,b] 上 偶数 个 a， 或 者 奇数 个 5 构成 的 字符 串 的 集合 。 

(a,b) KERA a 和 偶数 个 5 构成 的 字符 串 的 集合 。 这 里 有 点 小 技巧 : 构造 这 个 表达 式 的 策略 参见 第 6 
章 


使 用 表 2-1 中 给 出 的 正则 表达 式 恒等式 来 构造 下 面 的 恒等式 : 

a) (ba) '(a' b' Ua" ) 2 (ba) pa (b* UX) 

b) b'(a'b' UNX)b-b(b'a' UX)b* 

c) (aUb) = (aub) b" 

d) (aUb) ' =(a* Uba* )* 

ej (aUb)" S(b"(aUA)b")" 

在 2.4 节 的 凯撒 文件 中 ， 搜 索 分 别 满足 下 列 扩展 的 正则 表达 式 的 输出 。 

a) [Gc] 

b) [K -Z] 

€) \e [a -2] (6) NS 

d) \<[a-z]{6}\> I\< [a-z1 (7) N» 

设计 一 个 扩展 的 正则 表达 式 来 完成 对 地 址 的 搜索 。 针 对 这 个 练习 ， 一 个 地 址 要 包括 
i) 数字 ， 

i) 街道 名 字 ， 和 

ii) 街道 类 型 标识 符 或 是 缩写 。 

你 的 模式 应 该 匹配 形 如 1428 Elm Street, 51095 Tobacco Rd 和 1600 Pennsylvania Avenue 这 样 形式 的 地 

址 。 如 果 你 的 正则 表达 式 不 能 够 识别 所 有 可 能 的 地 址 ， 你 也 不 需要 担心 。 


参考 文献 注释 


正则 表达 式 是 由 Kleene [1956] 出 于 研究 神经 网 络 的 目的 提出 的 。McNaughton 和 Yamada 


[1960] 证 明正 则 集合 在 并 和 补 操作 下 是 封闭 的 。 正 则 表达 式 的 代数 学 公理 化 可 参考 Salomaa 【1966] 。 


第 二 部 分 
文法 、 自 动机 和 语言 


语言 的 文法 指定 了 语言 中 所 允许 的 字符 串 的 形式 。 在 第 2 章 中 ,集合 论 操 作 和 递归 定义 都 用 来 生 
成 语言 的 字符 串 。 这 些 构造 字符 串 的 工具 尽管 简单 ， 但 却 足够 用 来 确定 构成 字符 串 的 元 素 的 数量 和 顺 
序 的 简单 限制 。 我 们 在 这 里 要 介绍 一 种 基于 规则 的 方法 来 定义 和 生成 语言 的 字符 串 。 这 种 定义 语言 的 
方法 在 语言 学 和 计算 机 科学 中 都 有 它 的 本 源 : 语言 学 试图 形式 化 地 描述 自然 语言 ， 而 计算 机 科学 需要 
提供 准确 、 无 二 义 性 的 高 级 语言 定义 。 使 用 语言 学 的 术语 ， 我 们 称 字符 串 生成 系统 为 文法 。 

在 第 3 章 中 ,我 们 将 介绍 两 种 文法 : 正则 文法 和 上 下 文 无 关 文 法 。 一 族 文 法 是 通过 规则 和 它们 适 
用 的 条 件 的 形式 来 定义 。 规 则 给 出 了 字符 串 转换 的 方法 ， 语 言 的 字符 串 是 通过 应 用 这 一 系列 的 规则 来 
生成 的 。 由 规则 提供 的 灵活 性 已 经 证 明了 可 以 很 好 地 适用 于 定义 编程 语言 的 语法 。 描 绘 编程 语言 Java 
的 文法 给 出 了 构造 几 种 常见 的 编程 语言 的 上 下 文 无 关 定义 。 

利用 字符 串 的 产生 过 程 来 定义 语言 ， 我 们 就 可 以 把 关注 点 转移 到 机 械 验证 上 了 : 一 个 字符 串 是 否 
满足 期 望 的 条 件 ， 或 者 是 否 匹 配 了 期 望 的 模式 。 确 定型 有 限 自 动机 家 族 是 一 系列 功能 渐 强 的 抽象 机 中 
的 第 一 个 。 我 们 将 把 这 些 抽象 机 用 于 模式 匹配 和 语言 定义 中 。 之 所 以 把 机 器 看 成 抽象 的 ， 是 因为 我 们 
不 需要 考虑 它们 的 硬件 和 软件 实现 。 相 反 ， 我们 更 关心 这 些 机 器 的 计算 能 力 。 抽 象 机 的 输入 是 字符 
串 ， 计 算 的 结果 表明 了 其 对 输入 串 的 接收 能 力 。 机 器 的 语言 就 是 可 以 被 机 器 的 计算 过 程 接受 的 字符 串 
的 集合 。 

确定 型 有 限 自动 机 是 只 读 型 机 器 ， 它 会 根据 当时 机 器 的 状态 和 待 处 理 的 输入 字符 来 确定 要 执行 的 
指令 。 有 限 自动 机 有 很 多 应 用 ， 其 中 包括 计算 机 程序 的 词法 分 析 、 数 字 电 路 设计 、 文 本 搜索 和 模式 识 
别 。Kleene 理论 证 明了 有 限 自动 机 接收 的 语言 只 是 那些 可 以 用 正则 表达 式 描 述 并 能 由 正则 文法 生成 的 
语言 。 一 个 更 强大 的 只 读 机 器 就 是 下 推 自动 机 。 它 在 有 限 自动 机 的 基础 上 增加 了 一 个 栈 内 存 。 这 个 新 
添加 的 内 存 允 许 下 推 自动 机 接收 上 下 文 无 关 文法 。 

文法 所 生成 的 语言 和 文法 被 机 器 接受 之 间 的 对 应 关系 是 这 本 书 的 核心 主题 。 机 器 和 文法 之 间 的 关 
系 将 会 在 第 三 部 分 的 无 限制 文法 家 族 和 图 灵机 中 继续 介绍 。 正 则 文法 、 上 下 文 无 关 文法 和 无 限制 文法 
都 是 第 10 章 中 的 乔 姆 斯 基文 法 层次 中 的 成 员 。 








第 3 章 “ 上 下 文 无 关 文 法 


本 章 我 们 将 给 出 产生 语言 字符 串 的 基于 规则 的 方法 。 借用 自然 语言 中 的 术语 ， 我 们 称 一 个 语法 正 
确 的 字符 串 为 语言 的 句子 (sentence)。 英语 的 小 子 集 可 以 用 来 解释 字符 串 生成 过 程 的 构成 成 分 。 我 们 
缩小 的 语言 的 字母 表示 集合 la, the, John, Jill, hamburger, car, drives, eats, slowly, frequently, 
big, juicy, brown| 。 字 母 表 中 的 元 素 称 为 语言 的 终结 符 ( terminal symbols)。 大 写 、 标点 和 书面 语言 
的 其 他 重要 特点 在 这 个 例子 中 都 可 以 忽略 。 

句子 生成 程序 可 以 用 来 构造 字符 串 John eats a hamburger All Jill drives frequently, JE All Jill 和 car 
John slowly 的 字符 串 形 式 是 无 法 由 这 个 过 程 产生 的 。 在 构造 句子 的 过 程 中 还 可 以 使 用 其 他 符号 ， 来 强 
调 语言 的 语法 限制 。 这 些 中 间 符 号 ,叫做 变量 (variables) 或 非 终 结 符 (nonterminals) , 使 用 尖 插 号 
(〉 来 突出 表示 。 

因为 生成 程序 构造 了 句子 ， 所 以 初始 变量 也 叫做 《〈sentence) 。 句 子 的 生成 包括 把 变量 蔡 换 成 某 种 
特别 的 字符 串 形 式 ， 使 用 一 个 转换 规则 集合 可 以 完成 语法 的 正确 替换 。 对 于 变量 (sentence) 两 个 的 
可 能 规则 是 

1. (sentence) —(noun-phrase) ( verb-phrase ) 

2. (sentence) —(noun-phrase) (verb) ( direct-object-phrase ) 

规则 1 的 非 形式 化 解释 是 句子 可 以 用 一 个 名 词 短 语 ， 后 面 跟着 一 个 动词 短语 来 构成 。 当 然 ， 在 这 
点 上 ,变量 (noun-phrase) F (verb-phrase) 都 没有 定义 。 第 二 个 规则 给 出 了 句子 的 替换 定义 ， 即 : 
一 个 名 词 短语 ， 后 面 跟着 一 个 带 有 指定 对 象 短语 的 动词 。 多 种 转换 的 存在 暗示 了 语法 正确 的 句子 可 以 
有 不 同 的 形式 。 

名 词 短语 可 以 包括 一 个 特有 名 词 或 者 常用 名 词 。 常用 名 词 指 的 是 带 有 限定 词 的 ， 而 特有 名 词 指 的 
是 没有 限定 词 的 。 英 语 语法 的 特点 定义 为 规则 3 和 规则 4。 

产生 名 词 和 动词 短语 的 变量 规则 定义 如 下 。 我 们 依次 列 出 了 规则 的 右 侧 ， 而 不 是 重复 列 出 规则 的 
左 部 。 给 这 些 规则 编号 并 不 是 生成 过 程 的 特点 ， 只 不 过 是 为 了 方便 而 已 。 

3. (noun-phrase) —(proper-noun) 

4 —+( determiner) ( common-noun) 


5. (proper-noun) —John 


6. —Jlill 

7. (common-noun) —car 

8. —hamburger 

9. (determiner) —a 

10. —>the 

11. Cverb-phrase) —( verb) (adverb) 
12. —(verb) 

13. (verb) drives 

14. —eats 


15. (adverb) —slowly 

16. —»ffrequently 

BET (direct-object-phrase) 以 外 ， 每 个 变量 的 规则 都 给 出 了 。 

应 用 规则 的 使 用 ， 可 以 把 一 个 字符 串 转 化 成 男 一 个 字符 串 。 这 种 转化 指 的 是 把 一 左 侧 的 变量 替换 
成 它 右 侧 的 部 分 。 在 句子 的 产生 过 程 中 ， 反 复 地 应 用 规则 从 而 把 变量 (sentence) 转化 成 其 他 终结 符 
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号 字符 串 。 
iin; AF Jill drives frequently 是 使 用 下 面 的 转化 完成 的 。 
符号 二 用 来 指定 一 个 规则 应 用 , SEE MESES 


有 侧 的 列 给 出 了 变换 中 使 用 的 规则 的 序号 1 当 所 有 的 27 qs. un a 

变量 都 从 待 推导 的 字符 串 中 去 掉 时 ， 推 导 就 结束 可 5 De 

结果 的 字符 串 ， 仅 仅 包 括 终结 符号 ， 就 是 语言 的 名 “sill vérbiplirase) $ 

子 。 由 变量 (sentence) 开始 推 导 得 出 的 终结 字符 串 Jill verb) (adverb) 11 

的 集合 就 是 使 用 我 们 例子 中 的 规则 产生 的 语言 s Jill. drives adverb) 13 
为 了 使 我 们 的 规则 更 加 完整 ，〈direct-object-pjprase》 —Jill drives frequently 16 


的 转化 必须 给 出 。 在 给 出 这 个 规则 之 前 ， 我 们 必须 决 
定 要 产生 的 字符 串 的 形式 。 在 我 们 的 语言 中 ， 我 们 多 许 在 直接 对 象 之 前 存在 任何 数量 的 形容 词 包括 
重复 的 。 这 就 要 求 存在 一 个 能 够 产生 下 列 字 符 串 的 规则 集合 
John eats a hamburger 
John eats a big hamburger 
John eats a big juicy hamburger 
John eats a big brown juicy hamburger 
' John eats a big big brown juicy hamburger 
因为 形容 词 可 能 重复 出 现 ， 所 以 文法 的 规则 必须 能 够 产生 任意 长 度 的 字符 串 递归 定义 的 使 用 使 
Pi aR A RAE QUTGX ROS ST 6 在 这 个 例子 之 后 ， 递 归 将 被 引信 到 字符 串 生 成 过 程 当 
中 ， 即 ;引入 规则 
17. (adjective-list) —»( adjective) ( adjective-list) 


18. 一 入 
19. ( adjective) big 
20. — juicy 
21. .—brown 


(adjective-list) E SWR T MBB. LUI 17 BAM ET Cadjective-list)., ii LU 18 HEHE T 
- 归 定 义 的 基础 。 规 则 18 右 部 的 入 指 的 是 应 用 这 条 规则 ， 把 _《adjective-list》 替换 成 空 串 *7 重 复 使 用 规 
WW 17 就 产生 了 一 系列 的 形容 词 。(adjective-object-pjhrase》 的 规则 是 使 用 《adjective-list), 来 构造 的 a 
PHA direct-object-phrase ) —.(adjective-list) (proper-noun ) 








23. —+( determiner) ( adjective-list) ( common-noun) 
句子 John eats a big juicy hamburger 可 以 通过 使 用 下 面 的 一 系列 规则 推导 而 成 。 
推 导 ; 应 用 规则 
(sentence) = (noun-phrase) (verb) (direct-object-phrase) 2 

= (proper-noun) (verb ) (direct-object-phrase ) 3 
—John (verb) (direct-object-phrase) 5 
—John eats ( direct-object-phrase) 14 
= John eats (determiner) (adjective-list) ( common-noun) 23 
= John eats a (adjective-list) (common-noun) 9 
—John eats a\ (adjective) ( adjective-list) {common-noun) 17 
= John eats a big (adjective-list) <common-noun) 19 
=John eats a big. (adjective) ( adjective-list), ( common-noun) 17 
—John eats a big juicy (adjective-list) ( common-noun) 20 
John eats a big juicy (common-noun) 18 


= John eats a big juicy hamburger 8 


一 一 
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句子 的 产生 过 程 是 这 些 规则 严格 的 函数 。 字 符 串 the car eats slowly 是 这 种 语言 的 句子 ， 因 为 它 具 
有 规则 1 rp. (noun-phrase) (verb-phrase) 的 形式 。 这 就 解释 了 语法 和 语义 的 重要 区 别 。 句子 的 产生 
过 程 只 考虑 推导 的 字符 串 的 形式 ;而 不 考虑 它 与 终结 符号 相关 的 潜在 意义 。 

根据 规则 3 和 规则 4， 名 词 短 语 包 括 特定 名 词 或 前 面 带 限定 词 的 通用 名 词 。 变 量 (adjective-list) 
可 以 添加 到 《noun-phrase》 规 则 当中 ， 人 允许 形容 词 来 修改 名 词 。 

3’. ( noun-phrase) —»( adjective-list) (proper-noun) 

4’. —+( determiner) ( adjective-list) ( common-noun) 


使 用 这 种 修改 的 规则 ,字符 串 big John eats frequently 就 可 以 由 变量 《sentence》 推导 而 得 。 


3.1 上 下 文 无 关 文 法 和 语言 


我 们 现在 定义 一 个 形式 化 系统 一 上下文 无 关 文 法 ， 它 可 以 用 来 生成 一 种 语言 的 字符 串 。 自 然 语 
言 的 例子 用 来 描述 使 用 上 下 文 无 关 文 法 生成 的 字符 串 的 构成 成 分 和 具有 的 特点 。 

定义 3.1.1 上 下 文 无 关 文 法 (context-free grammar) 是 一 个 四 元 组 (V, X, P, S), xP, Vv 
AREXCAREO,XE (FHA) 是 终结 符 的 有 限 集合 ， P 是 规则 的 有 限 集合 ，8 区 别 于 V 中 的 元 
素 ， 称 为 开始 符 ， 并 且 还 假设 集合 V 和 并 是 不 相交 的 。 

规则 (rule) BA Aw 的 形式 ， 其 中 , AeV 并 且 we (VUE) ”。 这 种 形式 的 规则 称 作 A 规 
则 ， 指 的 是 变量 在 左边 的 。 因 为 空 串 属于 ,CYUZ) 所 以 入 可 能 出 现在 规则 的 右 侧 。 形 如 A= 的 
规则 称 为 空 规 则 : (null), 或 入 -规则 (N-rule) 。 

斜体 用 来 表示 上 下 文 无 关 文 法 的 变量 和 终结 符 。 终 结 符 用 字母 表 中 前 面 的 字母 的 小 写 形式 表示 
Eila, b, c, o 遵循 字符 串 定 义 的 规则 ， 没 有 或 有 上 上 角 标 的 字母 Pp，4，u， vim, x, Y, 表示 
(VU E) 中 的 任意 成 员 。 变 量 使 用 大 写字 母 表示 。 像 自然 语言 的 例子， 变量 是 文法 中 的 非 终 结 符号 
( nonterminal symbols) 。 

文法 用 来 产生 规定 字母 表 上 具有 正确 形式 的 字符 串 。 生 成 过 程 的 基础 步骤 包括 使 用 规则 来 转换 字 
符 串 。 把 Aw 应 用 到 uAv 中 的 变量 4 中 ， 就 会 产生 字符 串 wwv。 这 就 可 以 表示 成 My 一 wwv。 MA u 
BUS v 2 TARE A HUE E T xc (context) 。 本 章 介绍 的 文法 叫做 上 上 下文 无 关 ， 因 为 规则 是 通用 
Aj, 规则 可 以 用 到 变量 4 上 ,， 当 且 仅 当 变量 A 出 现 的 时 候 ， 并 且 只 可 以 用 在 它 出 现 的 地 方 。 上下文 
对 于 这 个 规则 的 应 用 没有 任何 限制 。 

如 果 应 用 有 限 条 规则 可 以 把 v 转化 成 w， 那 么 字符 串 w 可 以 由 Vv 推导 出 。 即 ， 如 果 使 用 文法 的 规 
则 可 以 构造 下 面 

VW, WS SSW, =w 

这 一 PPR Ay REM w RRR Sw, 应 应 用 有 限 步 规则 构造 的 从 v 推导 而 得 的 字符 串 的 集合 可 
以 递归 地 定 关 。 

定义 3.1.2 Bk G2 (V, E,P,S) € EF X X Xxk, 并且 VE(VU £)" Hv ES (deriva- 
ble) 的 字符 串 的 集合 可 以 递归 地 定义 为 : 

i) 基础 步骤 : v 可 以 由 v 推 导出 。 

i) 递归 步骤 : 如果 w=xAy 可 以 由 v 推 导出 ， 并 且 A->weP, 那么 xwy 就 可 以 由 v 推导 出 。 

ii) 封闭 : 字符 囊 可 以 由 v 推 导出 ， MH CTY tv 经 过 有 限 步 归纳 构造 而 成 6 

值得 注意 的 是 ， 规 则 的 定义 中 使 用 的 是 一 符号 ,而 不 是 坊 。 符号 己 表 示 可 推导 出 ， 而 之 表示 使 用 
至 少 一 步 可 以 推导 出 。 推 导 的 长 度 就 是 应 用 规则 的 数目 。 从 v 到 w 的 长 度 为 元 的 推导 表示 成 vw, 34 
AAT — AOE, BUTE vew 表示 应 用 了 文法 G 的 推导 规则 。 

语言 是 定义 在 字母 表 上 的 字符 串 的 集合 。 文 法 包含 字母 表 和 产生 字符 串 的 方法 。 这 些 字 符 串 既 
包括 变量 ， 也 包括 终结 符 。 设 想 《sentence) 在 自然 语言 例子 中 的 角色 ,文法 的 开始 符 初始 化 了 产 
生 可 接受 字符 串 的 过 程 。 文 法 G 的 语言 就 是 由 这 个 开始 符 推导 得 到 的 终结 符 的 集合 。 我 们 下 面 给 出 
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相应 的 定义 。 
定义 3.1.3 E, G- (V, ,P,S) EF X XXX, 
i) wR G 中 存在 推导 Sow, MAFA E we(VUE)' HX G HAH (sentential form) , 
ii) WRG 中 存在 推导 Sow, MAFHEwe Dd.” GAL (sentence), 
iii) GWiB (language), 32 L(G), 是 指 集合 jwE X | Sw}. 
名 型 是 由 文法 的 开始 符 推导 得 到 的 字符 串 。 回 顾 自 然 语 言 的 例子 ， 推 导 
(sentence) —(noun-phrase) | verb-phrase) 
=> proper-noun) ( verb-phrase) 
—3Jill( verb-phrase) | 
表明 Jill 《verb-phrase〉 是 文法 的 句 型 。 它 不 是 句子 ， 因 为 包容 变量 , 但 是 它 具有 句子 的 形式 。 句 子 
是 只 包含 终结 符 的 句 型 。 文 法 的 语言 包含 由 文法 产生 的 句子 。 如 果 字 母 表 并 上 的 字符 串 可 以 由 上 下 文 
无 关 文法 产生 ， 那么 这 些 字符 串 构成 的 集合 就 是 上 下 文 无 关 请 言 (context-free language) 。 
递归 的 使 用 对 于 构造 任意 长 度 的 字符 串 ， 以 及 由 无 穷 多 的 学 符 串 组 成 的 语 言 是 必要 的 。 递 归 是 通 
过 文法 引入 到 规则 当中 的 。 形 如 A 一 uAv 的 规则 是 递归 的 《recursive) ， 因 为 它 使 用 4 自身 来 定义 4。 
形 如 A 一 Av 和 A—uA 的 规则 分 别称 为 是 左 递 归 的 (left-recursive) 和 右 递 归 的 (right-recursive) 。 它 们 
的 名 字 暗 示 了 它们 在 规则 中 递归 的 位 置 。 
因为 递归 规则 的 重要 性 ， 所 以 我 们 检查 了 反复 使 用 的 过 归 规 则 A—aAb, A—aA, A—Ab " A—4AA 
生成 的 字符 串 形式 。 


A =aAb A —aA A —Ab A —AA 
—aAb —aA —Ab —AAA 
—aaAbb —aaA =Abb —AAAA 


—aaaAbbb —aaaA —Abbb —AAAAA 


FES Pf ALM A—aAb, 可 以 生成 一 定数 量 的 a， 然 后 后 面 紧 跟着 相同 数目 的 bs 这 种 形式 的 规 
则 对 于 生成 包含 成 对 符号 的 字符 串 是 必要 的 ,i 比如 左右 括号 a VAAL AoA 在 变量 4 之 前 产生 任 
意 数 目的 a， 而 左 递归 规则 A—Ab 在 变量 A 后 面 生成 任意 数目 的 b。 每 次 应 用 规则 A 一 44 一 一 这 个 规 
则 既是 左 递归 的 ， 又 是 右 递 归 的 一 一 就 会 增加 一 个 4A。 递归 规则 的 重复 使 用 可 以 利用 另外 一 个 4 规则 
来 终止 。 

如 果 存 在 推导 ASuAv, MARE A 是 递归 的 (recursive)。 形 如 A 二 w 坟 uAhv 的 推导 ， 其 中 , 4 不 
属于 w， 是 间接 递归 的 (indirectly recursive)。 值 得 注意 的 是 根据 间接 递归 ， 变 量 A 可 以 是 递归 的 ， 即 
使 不 存在 递归 A 规则 。 

图 3-1 给 出 了 文法 G， 这 种 文法 产生 了 包含 正 偶数 个 a 的 字符 串 的 语言 。 这 个 文法 的 规则 是 使 用 
速记 Aa |v KE Au Al Av, BHR“ | ” 读 作 “或 "。 图 3-1 给 出 了 终结 符 ababaa 的 四 种 不 同 
推导 。 推 导 的 定义 允许 字符 串 中 的 任何 变量 的 转化 。 推导-(a) 和 (b) 中 应 用 的 每 个 规则 转化 的 对 象 
的 都 是 字符 串 中 从 左 到 右 出 现 的 第 一 个 变量 。 具 有 这 种 性 质 的 推导 叫做 最 左 的 (1leftmost)。 推 导 (c) 
是 最 右 的 (rightmost) ， 因 为 每 次 规则 都 应 用 到 最 右边 的 变量 上 。 这 些 推导 表明 上 下 文 无 关 文 法 的 字 
符 串 存在 多 种 推导 。 

图 3-1 展示 了 上 下 文 无 关 文 法 的 推导 的 灵活 性 。 推 导 的 本 质 特 点 不 是 应 用 规则 的 顺序 ， 而 是 把 每 
个 变量 转化 成 终结 字符 串 方式 。 转 化 的 过 程 使 用 推导 和 分 析 树 的 形式 图 形 化 地 描述 出 来 。 树 的 结构 体 
现 了 应 用 到 每 个 变量 上 的 规则 ， 而 不 是 给 出 了 应 用 规则 的 顺序 s 推导 树 的 叶子 展示 了 树 表示 的 推导 的 
结果 。 


38 


PED 





Xx. AMPH 























S —AA S —AA S AA S AA 
—aA —AAAA 一 4a —aA 
—aAAA =aAAA =AAAa =aAAA 
=abAAA =abAAA =AAbAa =aAAa 
—abaAA —abaAA —AAbaa =abAAa 
—ababAA -»ababAA —AbAbaa —abAbAa 
—ababaA =ababaA | —Ababaa 
=ababaa —ababaa —»ababaa 
(a) (b) 
图 3-1 
[71 | 





—ababAa 
(c) 











—ababaa 

G 中 的 ababaa 的 推导 例子 
#t (derivation tree) DT 可 以 按照 下 面 循 环 构造 : 
i) 用 根 节点 8 来 初始 化 DT。 


, Xno 


(d) 
定义 3.1.4 已 知 G=( V, E,PE,S) £ ET XX XXik, JE SSw 是 G 中 的 推导 8 Sw ES 
AMF FAX, x, 
给 出 的 s 


ii) 如 果 A 一 xx,x，…X, 是 应 用 于 推导 字符 囊 uhv 中 的 规则 ， 并 且 x;e (VU )， 那 么 就 在 树 中 增加 
推导 


iii) 如 果 A 一 和 是 应 用 于 推导 字符 囊 uhv 的 规则 ， 那 么 就 在 树 中 A 的 子 节 点 增加 入 。 
叶子 的 顺序 也 遵循 这 个 循环 过 程 。 起 初 ， 惟 一 的 叶子 是 $， 顺 序 一 目 了 然 。 当 应 用 规则 Ax, x, 
SHER A WER, BS ARM TOR, FF ARS x, x), 


， 如 来 替换 A, AU Ad FE 
把 4 PERS, 3-2 跟踪 了 图 321 HES (a) 中 对 应 的 树 的 构造 过 程 。 叶 子 的 顺序 是 和 每 棵 树 一 起 
S 
—AA 


叶子 的 顺序 


S 
—aA 


A, A 


a 
一 0d44 


a A 


a, A, A, A 


图 3-2 推导 树 的 构造 
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推导 树 叶子 的 顺序 
—abAAA : S a,b, A, A, A 


—abaAA iis e a, b, a, A, A 


—ababAA a, b,a, b, A, A 


—ababaA a,b,a,b,a, A 


—ababaa a,b,a,b,a,a 


图 3-2 (4X) 


推导 树 上 的 叶子 的 顺序 独立 于 产生 树 的 推导 。 上 述 循环 过 程 提供 的 顺序 等 同 于 1.8 节 中 关系 
LEFTOF 中 给 出 的 叶子 的 顺序 。 推 导 树 的 边界 就 是 推导 产生 的 字符 串 。 

图 3-3 给 出 了 图 3-1 中 的 每 个 推导 对 应 的 推导 树 。 推 导 (a) 和 (d) 产生 的 树 是 同一 个 ， 这 就 意 
味 着 每 个 变量 都 转化 成 同一 模式 的 终结 字符 串 。 这 些 推导 的 惟一 区 别 就 是 规则 使 用 的 顺序 。 
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s € 4 
E qus FUN 
A Ec "Ds. T 
a A AÁ A A A A a 
Pd EM Dt BON PS 
b A b 2H ka a b PA b A 
NE! ME 
(a) (b) 
S S 
EE P RA 
ih A bcn Ee Peles 
a A A a a A <A A 
m 4 S ERE Ice ee 
A Ra, or a 


(c) (d) 
图 3-3 5 3-1 中 推导 对 应 的 树 


推导 树 可 以 用 来 产生 若干 个 推导 ， 这 些 推导 都 是 产生 同一 个 字符 串 的 。 应 用 到 变量 4 的 规则 可 以 
用 来 重 构 树 中 A 的 子 节点 。 最 右 推导 ， 
9 一 44 
=AAAA 
=AAAa 
=AAbAa 
=AAbaa 
—AbAbaa 
—Ababaa 
—ababaa 
是 从 图 3-3 中 的 推导 树 中 获得 的 。 值 得 注意 的 是 这 些 推导 不 同 于 图 3-1 中 的 最 右 推导 (c)。 在 后 者 的 
推导 中 ,字符 串 AA 的 第 二 个 变量 使 用 规则 A—a 进行 转化 ， 而 A—AAA 用 于 接 下 来 的 推导 。 这 两 棵 树 
图 形 化 地 解释 了 这 两 种 不 同 的 转化 。 
正如 我 们 看 到 的 ， 规则 的 上 下 文 无 关 应 用 使 得 构造 推导 的 过 程 中 存在 大 量 灵活 的 技巧 。 引 理 
3.1.5 证 明了 推导 可 以 被 字符 串 中 的 每 个 变量 拆 分 成 多 个 子 推导 。 推 导 可 以 递归 地 定义 ， 推 导 的 长 度 
是 有 限 的 ,但 是 却 是 没有 界限 的 。 因 此 ,我 们 可 以 使 用 数学 推理 来 证 明 一 种 性 质 ， 即 对 于 一 个 给 定 字 
符 串 的 所 有 推导 都 成 立 。 
引 理 3.1.5 已 知 G 是 上 下 文 无 关 文 法 ， 并 且 vw 是 G 中 的 推导 ， 其中, v 可 以 写成 
v= WA Wo As IAS, , i 
并 且 we 5 。 于 是 存在 字符 串 ppe( LUV) x 
i) Ap, | 


ii) W = WPi WPi SWPER GG PE 1 A 


i) V fcn DE 
证 明 : 对 从 v 到 w 的 推导 长 度 进行 归纳 证 明 。 
基础 步骤 : 基础 包括 形 如 vow 的 推导 。 在 这 种 情况 下 ，w =v 并 且 每 个 4, 都 等 于 对 应 的 p,。 期 望 
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的 推导 具有 Ap, 的 形式 。 i 
归纳 假设 : 假设 所 有 的 推导 vw 都 可 以 拆 分 成 : 由 A 开始 ， 变 量 是 v， 从 v 到 w 的 长 度 为 n 的 
推导 。 
归纳 步骤 : BU vbw Æ G PRES, IFA 
Vy =W A WA, WA, Wei 
Hwer’, IAEF vouw. 这 就 把 原始 的 推导 化 简 成 一 条 简单 规则 的 应 用 和 一 个 长 
EH n 的 推导 。 后 者 根据 归纳 假设 是 成 立 的 。 
推导 中 应 用 的 第 一 个 规则 是 "一 mw， 把 六 中 的 一 个 变量 变形 ， 记 作 4)， 形 如 规则 
A;—u,B,u; B, Up Bnin, 
其 中 ,每 个 ue Eo FRE u BE AE v AY A RRT ETARE, u 可 
以 写成 
wA **A; Wu B uB; Up B, Wi LA uam WAW. 
因为 w EEH nH u HE Se RE, REABRIR UE TE TE FER pi tns Pan di 77s 4, 
Lg NL Pp 满足 
i) F i=1, e, j-1, j+1, 5, E Ap, 
XPTd-l, e, mA B, 
ii) W = Wip WD; 1 Willy qiu QU aW; aja WIL a 2E BL 


ja k m 
iii) pA E p t+ > s,=n 
ixl zl 


把 规则 A,r, Bu, B, a, B, u, HUET B, eq, 相 结合 ， 我 们 就 会 获得 推导 
Aj, QU, Ma Inn +1 =P; 
这 个 推导 的 长 度 是 由 B FECA HES OO REED. HES A Sp (E81, JO BEGET h v Bl w 的 推导 的 理 
想 分 解 。 B 
引 理 3.1.5 表明 了 上 下 文 无 关 文法 推导 的 灵活 性 和 模块 性 。 每 个 复杂 的 推导 都 可 以 分 解 成 成 员 变 
量 的 子 推导 。 复 杂 语 言 设计 的 模块 性 体现 在 使 用 变量 定义 较 小 的 以 及 更 容易 管理 的 语言 的 子 集 上 。 这 
些 独立 定义 的 子 语言 和 其 他 的 规则 相 结合 ， 就 产生 了 整个 语言 的 语法 。 | 


3.2 文法 和 语言 的 例子 


上 下 文 无关 文 法 可 以 用 来 产生 语言 。 形 式 语言 ， 和 计算 机 语言 、 自 然 语言 类 似 ， 都 有 字符 串 需 要 
满足 的 要 求 ， 从 而 保证 它们 的 语法 正确 。 这 些 语 言 的 文法 必须 能 够 准确 地 产生 理想 的 字符 串 ， 而 不 是 
其 他 的 字符 串 。 我 们 可 以 使 用 两 种 普通 的 方法 来 帮助 理解 文法 和 语言 之 间 的 关系 。 一 种 是 首先 构造 语 
言 的 非 形式 化 规约 ， 然 后 构造 产生 这 种 语言 的 文法 。 这 是 遵循 编程 语言 设计 的 方法 一 一 选择 好 语法 ， 
然后 语言 设计 者 产生 一 个 定义 正确 形式 字符 串 的 规则 集合 。 与 之 相反 ， 另 一 种 方法 是 先 构造 文法 的 规 
则 ， 然 后 分 析 它 们 来 确定 语言 的 字符 串 的 形式 。 这 就 是 在 检查 计算 程序 代码 的 语法 时 经 常 使 用 的 方 
法 。 编 程 的 语法 是 使 用 一 个 文法 规则 集合 来 指定 的 ， 比 如 附录 IV 中 给 出 的 编程 语言 Java 的 定义 。 如 
果 代 码 可 以 由 文法 中 正确 的 变量 推导 得 出 ， 那 么 常数 、 标 识 符 、 语 句 和 整个 程序 的 语法 就 都 是 正 
确 的 。 

起 初 ， 确 定 字符 串 和 规则 之 间 的 关系 看 起 来 很 困难 。 但 随 着 经 验 的 增长 ， 你 就 可 以 识别 出 字符 串 
中 经 常 出 现 的 模式 ， 以 及 产生 它们 的 规则 。 本 节 的 目的 就 是 通过 分 析 例子 来 帮助 你 更 直观 地 理解 由 上 
下 文 无 关 文法 定义 的 语言 。 

在 每 个 例子 中 ,我 们 都 是 通过 列举 文法 的 规则 来 定义 文法 。 文法 的 变量 和 终结 符 就 是 规则 中 出 现 
的 那些 符号 。 变 量 5 是 每 种 文法 的 开始 符 。 
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例 3.2.1 已 知 G 是 按照 下 面 的 规则 给 出 的 文法 
S—aSa| aBa 
B-+bB | b. 
BBA L(G) = {a"b"a"|n>0, m>0|, AM S—aSa 递归 地 构造 了 首尾 具有 相同 数目 的 “的 字符 串 。 递 
归 过 程 的 终止 是 通过 使 用 规则 5S->aBa， 从 而 保证 至 少 有 二 个 处 于 首位 的 a 和 处 于 尾部 的 a; BI B XX 
则 产生 了 任意 数目 的 bs 为 了 从 字符 串 中 去 掉 变量 8 并且 获得 该 语言 的 句子 ,必须 应 用 规则 Bob, 
从 而 使 得 产生 的 字符 串 中 至 少 存在 一 个 bo ; LJ 
例 3.2.2 语言 la'b"c"d" |inz0, m>0} 中 开头 的 & 和 结尾 处 的 i'd 的 数目 之 间 的 关系 暗示 了 需 


要 一 个 递归 规则 才能 产生 它们 。b 和 < 的 个 数 也 一 样 。 文法 的 推导 


S—aSdd| A 

A—>bAc | bc 
产生 了 从 外 到 内 模式 的 字符 串 。 S 规则 产生 了 同样 个 数 的 a Aid, 而 A 规则 产生 了 同样 个 数 的 b 和 co 
应 用 规则 A—bc 终止 递归 过 程 ， 从 而 保证 子 串 bc 出 现在 语言 的 每 个 字符 串 中 。 i 口 


例 3.2.3 回想 如 果 w=w ， 则 字符 串 w 是 回 文 。 构 造 产 生 fa, b) 上 的 回 文 的 集合 的 文法 。 文 法 
的 规则 模仿 了 练习 2. 1. 2 中 给 出 的 回 文 的 递归 定义 。 回 文集 合 的 基础 包括 字符 串 入 ，& 和 bs S 规则 


Sa|b|A 
直接 产生 了 这 些 字符 串 。 定 义 的 递归 部 分 向 已 有 的 回 文 的 两 侧 增加 相同 的 字符 。 规 则 
S—asSa | bSb 
完成 了 递归 生成 过 程 。 E 


Bi 3. 2.4 
$—4aSb | aSbb | A 
的 第 一 个 递归 规则 为 每 个 a 产生 一 个 尾部 的 b, 第 二 个 规则 为 每 个 a 产生 两 个 b。 因 此 ， 对 于 每 个 a， 


至 少 有 一 个 ， 至 多 有 两 个 b。 这 个 文法 的 语言 是 {a"b” OS nzms2n| , D» 
例 3.2.5 考查 文法 
S—sabScB | A 
Es B—bB | b. 


递归 S 规则 产生 了 同样 数目 的 ab 和 cB。B 规则 产生 了 b*。 在 推导 中 ，B 的 每 次 出 现 都 会 相伴 产生 不 
同 数目 的 5。 例 如 ， 在 推导 
S —abScB 
—ababScBcB 
=ababcBcB 
—ababcbcB 
=ababcbcbB 
=ababchcbb , 
中，B 的 第 一 次 出 现 产 生 了 一 个 5, 第 三 次 出 现 产 生 了 5b。 这 个 文法 的 语言 是 集合 1(ab)" (cb™)" | 
nz0,m, > 0} o: m WEARER EA BB 产生 的 5 的 数目 ， 因 为 当 izj 时 ,，b" 不 必 等 于 b"。 LJ 
例 3.2.6 已 知 G, 和 G, 是 文法 
Gi ::.$—AB G,: S—aS| aA 
A—aA |.a A-+bA | A. 
B—bB|A 
这 两 种 文法 都 可 以 产生 语言 a^ b'. G, 中 的 4 规则 提供 了 产生 a 的 非 空 串 的 标准 方法 。 使 用 规则 可 
以 终止 推导 过 程 ， 从 而 允许 没有 也 的 出 现 。 文 法 G, 中 的 规则 从 左 到 右 地 构造 了 字符 串 a*b*。 t] 
例 3.2.7 文法 G, Al GAA {a,b} ERBEN b 的 字符 串 。 即 : 文法 的 语言 是 a ba' ba* 。 


BZF LTXXXxk 43 





G,: S—+AbAbA G,: S—aS$| bA 
A—aA | A 4 一 a4 | bC 
C—aC | A. 
Gi 要 求 只 有 两 个 变量 ， 因 为 ij” 的 三 个 实例 是 使 用 同一 个 治 规则 产生 的 a。 第 二 个 文法 从 左 到 右 地 构造 
了 字符 串 ， 并 使 用 每 个 不 同 的 变量 产生 一 系列 的 a。 o 
Gi 3. 2.8 进一步 修改 例 3. 2.7 中 的 文法 ， 使 得 字符 串 中 至 少 有 两 个 bs 
G,: S—AbAbDA G,: SaS| bA 
A—aA | bA| A A—aA | bC 
C-+aC | bC| 4. 


EGF, RH SA, FEAT SAP EB AB AT DAE RE b ZA. ZAZA. G PRES AL S— 
bA 产生 了 第 一 个 b, (FI AbC 产生 了 第 二 个 bs (EFA C 规则 结束 推导 ;从 而 可 以 生成 和 和 五 的 任何 
字符 串 。 E 
这 两 种 文法 产生 的 语言 称 作 是 等 价 的 〈equivalent) 。 例 3. 2.6、 例 3. 2. 7 和 例 3. 2. 8 显示 等 价 文法 
可 以 产生 推导 过 程 退 异 的 语言 的 字符 串 。 在 后 面 的 章节 中 ， 我 们 将 看 到 这 些 规则 存在 特殊 的 形式 ， 这 
些 规则 使 得 检查 字符 串 的 语法 是 否 正确 变 得 更 加 容易 了 。 
例 3.2.9 给 出 产生 |a,b} 上 包含 偶数 长 度 字符 串 的 语言 的 文法 。 相 应 的 策略 可 以 用 来 构造 长 度 
可 以 被 3、 被 4 等 整除 的 字符 串 。 变 量 $S MO 是 计数 器 。 每 当 产 生 侦 数 个 终结 符 时 ,5 就 出 现在 句 型 
当中 。0O 记录 了 奇数 个 终结 符 的 出 现 。 
$—5a0 | bO| A 
OaS| bS 
应 用 SA 完成 了 终结 字符 串 的 推导 。 反 复 应 用 8& 和 O 规则 直到 应 用 这 条 。  . E] 
例 3.2.10 EAL Æla, b] LAST b ASR. IER L 的 文法 
$—a$| bB| X 
B—aB | bS | bC 
CaC| X 
结合 了 前 面 例子 中 的 技巧 ， 包 括 例 3.2.9 中 生成 偶数 个 b 的 技巧 和 例 3.2.7 给 出 的 生成 任意 个 a 的 技 


巧 。 去 掉 所 有 包含 C 的 规则 ， 就 得 到 了 生成 L 的 另 一 个 文法 。 口 
例 3.2.11 练习 2.38 要 求 构 造 14,b| 上 由 包含 偶数 个 a 和 侦 数 ”变量 ME  - 

个 5 的 字符 串 构成 的 语言 的 正则 表达 式 。 值 得 注意 的 是 ， 在 那个 时 候 。 S fica, (NICO 

构造 这 种 语言 的 正则 表达 式 还 是 比较 复杂 的 。 按 照 规则 生成 的 字符 串 。 ”4 fiiit a, Ab 

所 提供 的 灵活 性 ， 使 得 构造 这 种 语言 的 上 下 文 无 关 文法 更 加 直接 。 一 Ma, M b 

些 变量 被 选 出 来 表示 推导 出 的 字符 串 中 的 部 分 Mb MMC. AO eita RP 


变量 的 解释 如 下 : 、 
应 用 规则 把 一 个 终结 符 添加 到 一 个 推导 出 的 字符 串 中 ， 并 更 新 变量 使 它 反映 最 新 的 状态 。 文 法 的 
规则 是 


S4aB | bA| X 

A—aC | bs 

B—aS | bC 

C—aaA | bB. 
当 出 现 变 量 5 时， 推导 出 的 字符 串 就 具有 偶数 个 a 和 偶数 个 bo MH 5 一 A 就 可 以 把 句 型 中 的 变量 去 
掉 ， 从 而 生成 满足 语言 规约 的 字符 串 。 口 


例 3.2.12 文法 的 规则 是 用 来 描述 语言 的 字符 串 结构 的 。 这 种 结构 确保 字母 表 中 元 素 的 某 种 组 合 
的 存在 或 不 存在 。 我 们 构造 字母 表 | a,b,c} 上 的 文法 ， 使 得 构造 得 到 的 语言 的 字符 申 不 包含 子 由 abc, 
变量 用 来 确定 现在 的 推导 距离 生成 字符 串 abe 还 有 多 远 。 
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S>bS | cS | aB\ x 
B—aB | cS | bC| X 
C—aB | bS| X 
字符 串 是 按照 从 左 到 右 的 方式 构造 的 。 至 多 有 一 个 变量 出 现在 句 型 当中 。 如果 有 S. 那么 就 不 会 
向 推导 出 abc 的 方向 进行 。 当 前 一 个 终结 符 是 a 时 ,变量 B 出 现 。 变量 C 出现 仅 当 之 前 是 abs 因此 
C 规则 不 可 能 生成 终结 符 cs " oO 


3.3 正则 文法 


正则 文法 是 上 下 文 无 关 文法 的 重要 组 成 子 集 ， 它 在 词法 分 析 和 编程 语言 的 分 析 中 扮演 着 重要 的 角 
Go 正则 文法 是 通过 对 规则 的 右 侧 进行 限制 而 获得 的 。 在 第 6 章 中 我 们 将 证 明正 则 文法 可 以 精确 地 定 
义 正则 表达 式 定义 的 语言 , 或 是 有 限 自 动机 接收 的 语言 。 

定义 3.3.1 正则 文法 (regular grammar) 是 满足 下 面 要 求 的 上 下 文 无 关 文 法 . 

i) Aa, 

ii) AaB, XX 

iii) 4 一 入 ， 
XT,4A,BeV3tHaeY, 

,正则 文法 中 的 推导 具有 相当 好 的 形式 。 在 句 型 中 至 多 有 一 个 变量 。 并 且 ， 如 果 有 变量 的 话 ， 变 量 
一 定 是 在 字符 串 的 最 右 侧 。 每 个 应 用 的 规则 都 把 终结 符 添加 到 推导 的 字符 串 中 ,直到 应 用 形 如 Aa 
或 4 一 A 的 规则 来 终结 整个 推导 。 这 些 性 质 可 以 用 正则 文法 G, 

Sas | aA 
ABA | X 
来 解释 。 根 据 例 3.2.6 可 以 产生 语言 a*b" 。aabb 的 推导 
9 sas 
—aaA 
—aabA 
—aabbA 
—aabb, 
给 出 了 从 左 到 右 的 生成 终结 符 的 前 级 的 过 程 。 推 导 终 结 于 规则 A—2A 的 使 用 。 

使 用 正则 文法 生成 的 语言 叫做 正则 (regular) 语言 。 读 者 可 以 参考 第 2 章 介 绍 的 正则 语言 家 族 来 
回顾 由 正则 表达 式 描述 的 语言 的 集合 。 这 个 对 同一 个 术语 的 两 个 不 同 定 义 是 不 矛盾 的 ， 因 为 我 们 证 明 
了 正则 表达 式 和 正则 文法 定义 的 是 同一 族 的 语言 。 

正则 语言 可 以 使 用 正则 文法 和 非 正则 文法 生成 。 例 3.2.6 中 的 文法 G 和 G, 都 可 以 生成 语言 
a'b', XÈ G, 不 是 正则 的 ， 因 为 规则 S-*4B 不 符合 要 求 的 形式 。 如 果 语 言 可 以 被 某 种 正则 文法 产 
生 ， 那 么 这 种 语言 就 是 正则 的 。 存 在 生成 该 语言 的 非 正则 文法 并 不 影响 该 语言 的 正则 性 。 例 3. 2. 9、 
例 3.2.10、 例 3.2.11 和 例 3. 2. 12 中 的 文法 提供 了 正则 文法 的 其 他 例子 。 

例 3.3.1 我 们 为 一 种 上 下 文 无 关 文法 生成 的 语言 构造 一 种 正则 文法 

G;S—ab$A | X 

A—Aa| 入 . 
G 的 语言 的 是 NU(ab) 'a* 。 等 价 的 正则 文法 是 

| SaB| 入 

B—>bS | bA 

A—ah | 入 
按照 从 左 到 右 的 方式 产生 字符 串 。S 和 B 规 则 产生 了 集合 (ab) HAAR, 如 果 字 符 串 中 有 后 绥 ,a,， 则 
使 用 规则 B—bA, A 规则 用 来 产生 字符 串 的 剩余 部 分 。 js] 


/ 
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3.4 验证 文法 


前 面 几 个 小 节 中 的 文法 是 用 来 产生 特定 的 语言 的 5 我 们 已 经 给 出 直观 的 论据 来 证 明文 法 确实 产生 
了 字符 串 的 正确 集合 。 但 是 无 论 论据 多 么 有 说 服 力 ， 都 有 出 现 错误 的 可 能 性 。 因 此 ,需要 使 用 证 明 来 
保证 二 个 文法 能 精确 地 产生 期 望 的 字符 串 。 
为 了 证 明文 法 G 定义 的 语言 和 给 定 的 语言 相同， 就 必须 构造 包含 关系 LCL(G) 和 L(G) CL, 
为 了 演示 这 个 过 程 中 涉及 到 的 技术 ;我 们 将 证 明 下 面 文法 定义 的 语言 
G: S—AASB | AAB 
A—a 
B—bbb 
MERAL = {ab | n>0}., 
如 果 终 结 字符 串 可 以 由 开始 符 使 用 文法 的 规则 推导 


得 出 ， 那 么 它 就 属于 这 种 文法 定义 的 语言 。 通 过 证 明了 7 一 一 推 号 RRISRUM _ 
中 的 每 个 字符 上 串 都 可 以 由 'G 推 坚 ， 我 们 构造 了 包含 关 Se (Aa) 8B S—AASB 
&a"b^| n0] CL(G) HA LURER FRR, Bro mE SAAB 
以 我 们 不 能 构造 L 的 每 个 字符 串 的 推导 过 程 ; 不 幸 的 。 过 (aa)"p Asa 


是 ， 这 恰恰 就 是 我 们 需要 做 的 。 这 个 显而易见 的 困难 可 =, ( aa)" ( bbb)" = q^ pon B—bbb 

以 使 用 推导 框架 来 解决 -框架 用 来 构造 七 中 的 字符 申 的 一 一 一 一 一 一 一 一 一 一 一 ~ 
推导 模式 。 形 如 a"b™(n>0) 的 字符 串 ， 可 以 使 用 下 面 的 规则 序列 推导 得 出 : 

其 中 ， 之 上 的 上 标 说 明了 规则 的 使 用 次 数 。 前 面 的 框架 提供 了 一 个 “处 方 ”， 遵 循 它 就 可 以 产生 工 中 
:的 任何 字符 串 的 推导 。 

反 包 含 L(G) C a”"b™ | n>0} ,要求 G 中 的 每 个 可 推导 出 的 字符 串 具 有 集合 工 描述 的 形式 。 语 言 
中 每 个 字符 串 的 推导 过 程 中 都 要 使 用 有 限 次 规则 ， 这 就 意味 着 可 以 使 用 归纳 证 明 。 第 一 个 困难 是 要 精 
确 地 给 出 需要 证 明 的 对 象 。 我 们 希望 构造 G 上 所 有 字符 串 中 的 a 和 4 的 个 数 之 间 的 关系 。 字 符 串 w 是 
L 中 的 成 员 的 必要 条 件 ， 就 是 字符 串 w 中 a 的 个 数 是 5b 的 个 数 的 2/3。 令 n (Qu) JE E TERR u 中 字符 x 的 
数目 ， 那 么 这 个 关系 就 可 以 表示 成 3n,(4) =2n,(4)。 

终结 字符 串 中 符号 之 间 的 数量 关系 对 于 S 推导 出 的 每 个 字符 串 未 必 都 成 立 。 考 虑 推导 

S AASB 
—aASB. 
由 GAMESHBIOSEREB ASB, DANa, BRA b. | 

为 了 考虑 推导 过 程 中 出 现 的 中 间 句 型 ， 我 们 必须 确定 变量 和 终结 符 之 间 在 所 有 推导 步骤 中 总 成 立 
的 那些 关系 。 当 推导 出 一个 终结 字符 串 时 ， 里 面 不 再 有 变量 ， 并 且 这 种 关系 就 会 使 得 产生 的 字符 串 具 
有 所 需 的 结构 。 | | à: 

我 们 必须 考察 G 中 规则 的 变量 和 终结 符 之 间 的 交互 ， 从 而 确定 它们 对 于 推导 终结 字符 串 的 作用 。 
规则 A—a 保证 每 个 A 最 终 会 被 一 个 a 替换 。 推 导 结果 中 a 的 数 自 包含 那些 已 经 出 现在 字符 串 中 的 ， 
以 及 字符 串 中 4 的 数目 。m(z) +m(u) 的 和 代表 由 推导 出 一 个 终结 字符 串 中 必然 产生 的 a 的 数目 。 
类 似 地 ， 每 个 吾 都 被 字符 串 bbb EHR, h u 推导 出 的 终结 字符 串 中 刁 的 数目 就 是 nn,(w)+3ns(u)。 根 
据 上 述 这 些 观 察 ， 我 们 可 以 以 此 来 构造 条 件 (i 让。 这 个 条 件 构 造 了 变量 和 终结 符 之 间 的 对 应 关系 ， 并 
且 保 证 这 种 对 应 关系 对 于 推导 过 程 的 每 一 步 都 成 立 。 

i) 3(n,(u) +n,(u)) =2(n,(u) *3n4(u)) 

可 以 看 出 , 由 G 推导 出 的 字符 串 GASB 满足 这 个 条 件 ， 因 为 ，n, (a45B) +n, (aASB) =2 2E A 
n, (aASB) +3n,(aASB) =3。 

条 件 Gi) 和 条 件 Ci) 是 

i) n,(u) +n,(u) >1 MEH 

ii) 名 型 中 的 每 个 a 和 A 出 现在 5 之 前 ,而 5 PERE b ABH. 
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[d^ b^ | n>0| 中 的 所 有 字符 串 包含 至 少 两 个 a 和 三 个 b。 条 件 G) 和 条 件 Gi), 相 结合 可 以 得 


. 到 这 条 性 质 。 条件 (ui) 规定 了 推导 字符 串 中 字符 出 现 的 顺序 。 并 不 是 所 有 的 字符 都 出 现在 每 个 字符 


串 中 使 用 一 条 规则 ,由 5 推导 出 的 字符 串 不 可 能 包含 终结 符号 。 

确定 了 上 述 这 些 正 确 关系 之 后 ,我 们 必须 证 明 它们 对 于 由 S$ 推出 的 每 个 字符 串 都 成 立 ,归纳 的 基 
础 包括 所 有 推导 长 度 为 1 (8 规则) 的 字符 串 。 归 纳 假设 保证 条 件 对 于 所 有 推导 长 度 不 超过 的 字符 
串 都 可 以 成 立 。: 并 且 ， 归 纳 步 又 中 包括 了 4; 证 明 应 用 一 条 补充 规则 仍 能 保持 这 种 关系 。 

有 两 个 长 度 为 1 的 推导 SS AASB 和 13 全 44B5 对 于 这 些 字 符 串 中 的 每 二 个 ,都 有 3n). + n, 
(u)) =2(n,(u) +3n,(u)) 26, HEUS, ARP Gi) PMA Cii) 对 于 这 两 个 字符 串 都 成 立 。 

归纳 假设 要 求 (i). Gi) Al Cii) 对 于 所 有 推导 长 度 不 超过 的 字符 串 都 成 立 。 我 们 现在 使 用 归 
纳 假设 来 证 明 这 三 个 性 质 对 于 应 用 推导 长 度 为 n +1 的 所 有 字符 串 都 成 立 。 

令 w 是 由 5 使 用 长 度 为 n+1 的 推导 S E w 获得 的 字符 串 。 为 了 使 用 归纳 假设 , 我 们 把 长 度 为 
n+1 的 推导 写成 长 度 为 n 的 推导 ， 然 后 应 用 一 条 规则 : 

S Suw: 

写成 这 种 形式 后 ， 很 明显 字符 串 志 可 以 由 奴 次 应 用 推导 规则 获得 ; 归纳 假设 断定 性 质 (i) HEI 
(Gi) MPE (iii) XF u 成立。 归纳 步 又 需要 我 们 证 明 对 忌 应 用 王 次 推导 规则 仍 保持 这 些 性 质 ， 

对 于 任何 名 型 vy, 我 们 令 j(v) 236,0) en, (v) ) F kC) 22€, (v) *3n5() ) 根据 归纳 假设 ， 
J(u) =k(u) fll j(u)/3 21, IFR 4 的 组 成 成 分 应 用 另 汪 条 补充 规则 的 结果 ， 如 下 面 的 表格 所 示 











规 则 ilw) k(w) j(w)/3 
S—AASB j(u) +6 k(u) +6 JCu) 73 +2 
S—AAB j(u) +6 k(u) +6 jCu)/3 +2 
Aa Cu) k(u) j(u)/3 
B—bbb jiu) ^ k(u) « jCu) 73 


因为 i(u) =K(24)， 所 以 我 们 得 出 结论 jw) =k(w)。 类 似 地 ,根据 归纳 假设 j(u)/3 > 1 就 有 
JCOw)/3 >1。 每 次 应 用 每 条 规则 的 时 候 ， 要 么 把 S 替换 成 具有 适当 顺序 的 变量 序列 ， 要 么 把 一 个 恋 量 
转化 成 对 应 的 终结 符 ， 这 样 获得 符号 的 顺序 就 可 以 得 到 保持 。 

我 们 已 经 证 明了 对 于 G 中 每 个 可 导出 的 字符 串 ， 三 个 条 件 都 成 立 。 因为 字符 囊 weL(G) 中 没有 
变量 ， 所 以 条 件 (i) 意味 着 3n,(w) =2n,(w)。 条 件 (ii) 保证 a M b 的 存在 ， 而 条 件 (ii) ME 
序 。 因 此 L(G) C Ia" b^ | n»0], 构造 完 反 包 含 关系 之 后 ,我 们 得 到 G 的 语言 是 ab | n>0|。 

te 证 明文 法 产生 某 种 语言 是 个 复杂 的 过 程 。 当 然 ， 上 面 展示 的 还 仅仅 是 
一 个 极 简单 的 文法 ,, 它 只 有 几 条 规则 。 确定 了 正确 的 关系 后 ,归纳 过 程 就 变 得 很 直接 了 。 归 纳 证 明 中 
最 具 挑 战 的 地 方 在 于 ， LA ae 如 果 去 掉 对 变量 的 引 
用 就 可 以 得 到 具有 期 望 结 构 的 终结 字符 串 ， 那 么 这 种 关系 就 是 充分 的 。 

正如 在 前 面 的 证 明 中 所 看 到 的 , :构造 产生 语言 的 文法 G 需要 满足 下 面 两 点 : 

i) 荆 中 所 有 的 字符 串 都 可 以 由 G 推导 出 ， 并 且 

ii) G 产生 的 所 有 字符 串 都 属于 工 。 

前 者 是 通过 提供 一 种 可 以 用 于 产生 七 中 任何 字符 串 的 推导 框架 来 完成 的 。 而 后 者 则 是 使 用 归纳 证 
明 来 证 明 每 个 句 型 都 满足 用 以 生成 工 中 的 字符 串 的 条 件 。 下 面 的 例子 进一步 的 解释 了 这 些 证 明 的 
ER o 

Gil 3.4.1 4 G Ei) 3.2. 10 中 给 出 的 文法 

$—4aS$| bB| N 

B—aB | bS| bC 

C—aC | 4. 
我 们 要 证 明 L(G) =a" (a* ba' ba^ ) ' , ERRA{ a,b) 上 具有 偶数 个 书 的 字符 串 的 集合 。 每 个 由 S HE 
导出 的 字符 串 都 有 偶数 个 2， 这 种 说 法 是 不 正确 的 : 推导 SDB 就 产生 了 一 个 b3 为 了 推导 出 终结 符 ， 
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每 个 B 必须 最 后 转化 成 一 个 bo 因此, 我们 得 到 结论 ; 期 望 的 关系 保证 了 n, (u) * ny Cu) RR. 24) 
结 字符 串 w 被 推导 出 时 ,ns(w) =0， 并 且 n,(w) 是 偶数 。 

我 们 要 证 明 ,， 对 于 由 5 推导 出 的 所 有 字符 串 > RA n, Cu) +na(w) 是 偶数 的 s 证 明 是 对 推导 的 长 
度 进行 归纳 。 

基础 步骤 ; 长 度 为 工 的 推导 有 下 面 三 个 。 

i SaS 

S=bB 
S>). 
根据 观察 ; n, (u) +ns(w) 对 于 这 些 字符 串 都 是 偶数 。 i 

归纳 假设 : 假设 应 用 上 述 规 则 n 所 得 到 的 所 有 字符 串 4, 都 满足 (wu) + n4 Cu) ER 

归纳 步骤 : 为 了 完成 证 明 ， 我 们 需要 证 明 当 每 个 w 都 是 由 形 如 5 Ls 光 的 推导 获得 时 ，n, Cw) + 
na(w) 是 偶数 。 关键 的 步骤 是 要 重新 描述 推导 ， 从 而 使 这 个 推导 很 容易 应 用 归纳 假设 。 长 度 为 n+ 十 的 
推导 可 以 写成 5 Susw. 


根据 明 纳 假设 ，n, (u) n, Cu) 是 偶数 。 我 们 证 明 规 则 n,(w) *ng(w) 
把 任何 规则 应 用 到 u 都 可 以 保持 n, (u) +, Cu) 的 奇偶 S—aS ny(u) +ng(u) 
性 二 右 侧 表格 给 出 了 当 应 用 相应 的 规则 到 v 时 ;获得 的 S—»bB ty (a) + na (ur? 
n,Cw) +n,(w) Mf. ESA CER T 586 24, EHS. Sd ny (Qu) *ng(u) 
和 增加 2) 使 得 B 和 45 的 个 数 固定 不 变 。 因 此 ， 应 用 B—aB n, (u) + ngu) 
一 条 规则 到 u 获得 的 字符 串 中 心 和 五 的 个 数 和 是 偶数 。 B—»bS ny(u) + ng(u) 
因为 终结 字符 串 中 不 包含 B， 所 以 我 们 证 明了 L(G) B—bC ny(u) *ng(u) 
中 的 每 个 字符 串 都 有 偶数 个 b。 C—aC ny(u) &ng(u) 

为 了 完成 这 个 证 明 ， 我 们 必须 完成 反 包含 关系 cox ny Cu) &ng(u) 


L(G) Ca‘ (a' ba ba* ) ' 的 证 明 s 为 了 证 明 它 ， 我 们 

要 证 明 a* (a* ba" ba? )" — G 推 导出 。 a" (a* ba* ba" xr 中 的 字符 串 具 有 形式 
a" ba" ba^ ---a'" ba^" ,k>0. 

性 中 的 任何 字符 串 都 可 以 使 用 S—aS 和 SA 获得 。 L(G) 中 的 所 有 其 他 守 符 串 都 可 以 使 用 下 面 形式 的 

推导 得 到 。 








应 用 的 规则 
- 5 X S—aS 
—— a" bB bu 
35 Bl T 
— a" ba" bS TH | 
- a"! ba"? ba" +++ a"? B nm 
—> a"! ba"? ba"? ++ a"2*bC AE 
ZE a" ba"? ba'^ -+ a"2kba"2+1 C | P 
一 一 一 一 0 


例 3.4.2 已 知 G 是 文法 
S—aASB | X 
A—»ad | d 
B—bb. 
我 们 证 明 L(G) 中 的 每 个 字符 串 中 a 和 4 的 个 数 相等 。 终结 字 符 串 中 4。 的 个 数 依赖 于 推导 的 中 间 步 又 
Ag b A BRA BI BEAD b, Wd A 至 多 产生 一 个 as 我 们 要 证 明 , “对 于 G 的 每 个 句 型 
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u, 都 有 WW) tn) <ny(u) «2n,(u)s BAGU) 2n, Cu) &n,Cu) Al k(u) =n, (u) +2n,(u) o 
基础 步骤 : 有 两 个 长 度 为 1 的 推导 。 


并 且 ， 对 于 这 两 个 推导 得 出 的 字符 串 都 有 天 万 ek) 5 一 
归纳 假设 : 假设 对 于 所 有 由 S 推导 的 长 度 不 少 于 的 字符 串 w， oO b 
都 有 j(4) <k(u) o 


归纳 步骤 : 我 们 需要 证 明 当 5 wht, jw) skw), w 的 推导 可 以 重 写成 5 加 uw， 根 据 归纳 
假设 , ju) ku) 。 我 们 必须 证 明 使 用 另外 一 条 规则 可 以 保持 这 种 不 等 关系 。 每 次 对 j 和 应 用 规则 
的 结果 如 下 表 所 示 : 





第 一 条 规则 给 不 等 式 的 两 侧 增加 2， 从 而 保持 了 这 种 规则 jw) ^ —— kw) 
不 等 关系 。 最 后 的 规则 从 比较 小 的 二 侧 减 去 鸟 ` 从 而 增强 SABE |j(u) +2 k(u) +2 
TERBURAEX E 3 WEE we L(G), 可 以 得 到 不 等 Sx ju) k(u) 

RA ni(w) <, (w) [1 ant an d 

例 3.4.3 在 例 3.2.2 rp, 文法 kde quel ue 

G; S—aSdd| A 
A—bAc | bc 


是 用 来 构造 语言 L= la'b"c"d"Inz0,m»0| 的。 我 们 构造 了 足以 证 明 L(G) CL 的 变量 和 终结 符 之 间 
的 关系 。5 规则 和 A 规则 强化 了 a 和 4 以 及 b 和 的 数目 之 间 的 数字 关系 。 在 G 的 推导 中 ,使 用 规则 
SA, KHT AIT A 的 存在 保证 最 后 会 产生 5。 依据 这 些 分 析 ， ge 对 
于 G 中 的 每 个 句 型 4x, 都 有 

i) 2n,(u) =n,(u) 

ii) n,(u) 2n.(u) 

ii) ns(u) +n,(u) +n,(u) >0 

iv) a 在 5 之 前 , 它们 在 S$ 或 4 之 前 ， 这些 发 生 在 c 之 前 , 所 有 这 些 都 发 生 在 如 之 前 。 

等 价 关系 保证 终结 符 出 现在 正确 的 数字 关系 中 s 语言 的 描述 也 要 求 终结 符 以 特定 的 顺序 出 现 。 最 
后 的 条 件 保证 推导 中 每 一 步 的 顺序 。 O 


3.5 最 左 推 导 和 二 义 性 


文法 的 语言 是 可 以 由 开始 符 按照 某 种 形式 推导 得 出 的 终结 字符 串 的 集合 :终结 字符 串 可 以 由 一 定 
数目 的 推导 产生 。 例 如 ， 图 3-1 给 出 了 使 用 文法 规则 定义 的 文法 ， 以 及 字符 串 ababaa 的 四 种 推导 。 这 
其 中 的 任何 一 种 推导 都 足以 显示 字符 串 的 语法 正确 性 。 

本 章 介 绍 的 自然 语言 例子 使 用 的 推导 都 是 最 左 推导 的 。 对 于 英语 的 读者 而 言 ， 这 是 一 种 自然 的 技 
术 ， 因 为 最 左 变量 是 读 字 符 串 遇 到 的 第 一 个 变量 。 为 了 减少 确定 一 个 字符 串 是 否 属于 二 种 文法 的 语言 
的 推导 步 数 ， 我 们 证 明 语言 的 每 个 字符 串 都 可 以 由 最 左 推导 得 出 。 

定理 3.5.1 已 知 G=(V, 正 ,P,S) 是 上 下 文 无 关 文 法 。 字 符 串 w 属 于 L(G) 当 上 且 仅 当 Ww 存在 由 5 
开始 的 最 左 推导 。 

证 明 : 显然 , 若 w 存在 由 5 开始 的 最 左 推 导 ， 则 有 weL(G)。 我们 必须 构造 等 价 的 “ 仅 当 ” 关 
系 ， 即 : L(G) 中 的 每 个 字符 串 都 可 以 最 左 推导 出 。 已 知 

Swr=W WW =w 
是 w 在 G 中 的 推导 , 但 不 必 一 定 是 最 左 的 。 上 下 文 无 关 文 法 中 ， 规则 应 用 的 无 关 性 可 以 用 于 构造 w 
的 最 左 推导 。 已 知 w 是 应 用 推导 规则 的 第 一 个 句 型 , :但 是 这 个 推导 不 是 最 左 的。 如 果 没 有 这 样 的 
那么 推导 就 是 最 左 的 ， 于 是 就 不 需要 证 明了 。 我 们 表明 记录 规则 的 应 用 过 程 ， 从 而 保证 前 上 +1 条 规 
则 都 是 按照 最 左 推导 的 原则 应 用 的 。 如 果 需 要 的 话 ， 我 们 可 以 重复 这 个 过 程 n -上 次 ， 从 而 产生 一 个 
最 左 推导 。 
选择 wi ,推导 5 Sw, 是 最 左 的 。 假设 4 是 wk 的 最 左 变量 ,:B 是 在 推导 的 第 k+1 步 进行 转换 的 变 


B3F EFLARLE 49 





Ht. w, YUB u Au, Bu, Epu e X^. MARU Bov 到 wi， 得 到 
W, = u, Au, Bu, =u Au vu; = W,,,. 
因为 w 是 终结 字符 串 ，A4 规则 必须 最 后 应 用 到 w, 的 最 左 变量 上 。 已 知 第 一 个 推导 规则 可 以 在 原始 推 
导 的 第 j+1 个 位 置 出 现 的 变量 直 进 行 替 换 。 那 么 应 用 规则 Ap 可 以 写成 
w; 2 u, Aqu, pg =W,- 
在 第 上 +2 28. j 应 用 规则 ， 把 字符 串 us vu, 转化 成 45 推导 可 以 通过 子 推导 完成 
WW, =W: 

原始 推导 被 拆 分 成 五 个 子 推导 。 所 应 用 的 前 类 个 规则 都 是 最 左 的 ， 因 此 它们 还 不 是 完整 的 。 为 了 
构造 最 左 推导 ， 规 则 Ap 应 用 到 第 k+1 步 的 最 左 变量 。 应 用 规则 的 上 下 文 无 关 本 质 允 许 这 种 安排 。 
第 k+1 步 规则 应 用 最 左 推导 得 到 的 w 可 以 按照 下 面 这 样 的 推导 获得 : 


k 
S w, = uAwBus 


upu, Bu, (应 用 A 一 p) 
=U, pu; Vus (应 用 Bv) 
Z upg = Wj. (使 用 推导 us vu, 5q) 
= w,. CE FHHESE w; Sw). 
每 次 重复 这 个 程序 ， 推 导 就 会 变 成 “更 多 ”最 左 。 如 果 推 导 的 长 度 是 n， 那 么 至 多 重复 n 次 就 产生 了 
w 的 最 左 推导 。 m 


定理 3. 5. 1 并 不 保证 文法 的 所 有 句 型 都 能 够 由 最 左 推导 产生 。 仅 仅 是 终结 字符 串 的 最 左 推导 能 够 
得 到 保证 。 考 虑 文法 
S—AB 
A-»aA | X 
B—bB| X 
J*^Ea'b' 。 句 型 4 可 以 通过 使 用 最 左 推导 SAB-A 获得 。 很 容易 看 出 没有 A 的 最 左 推导 。 
类 似 的 结果 (练习 31) 构造 了 使 用 最 左 推导 来 生成 终结 字符 串 的 有 效 性 。: MA v Bw 的 最 左 推导 
和 最 右 推导 可 以 清楚 地 表示 成 vw Al v Sw, 
把 我 们 的 注意 力 放 在 最 左 推 导 上 ， 从 而 减少 一 个 字符 串 的 可 能 的 多 种 推导 。 这 种 化 简 足 以 构造 一 
个 规范 推导 ? 即 ， 文 法 的 语言 中 的 每 个 字符 串 是 否 都 存在 惟一 的 最 左 推导 ? 不 幸 的 是 ， 回 答 是 不 。 字 
符 串 ababaa 的 两 个 最 左 推导 如 图 3-1。 
具有 若干 种 最 左 推 导 的 字符 串 存在 着 二 义 性 的 表示 。 形 式 语 言 的 二 义 性 类 似 于 自然 语言 经 常 遇 到 
的 二 义 性 。 句 子 Jack was given a book by Hemingway 具有 两 种 不 同 的 结构 分 解 。 前 置 词 短 语 by Hem- 
ingway 可 以 修改 动词 was given 或 者 名 词 book。 使 用 这 些 分 解 的 结构 可 以 构造 语法 正确 的 句子 。 
计算 程序 的 编译 使 用 了 产生 机 器 语言 代码 的 分 析 器 生成 的 推导 。 具 有 两 种 推导 的 程序 的 编译 只 使 
用 一 种 可 能 的 解释 来 产生 执行 代码 。 这 样 ， 一 个 运气 不 好 的 程序 员 在 调试 的 时 候 可 能 会 碰 上 这 样 的 情 
况 ， 根 据 编程 语言 的 定义 ， 程 序 是 完全 正确 的 ， 但 是 这 个 程序 执行 的 行为 却 和 预期 的 不 同 。 为 了 避免 
出 现 这 种 情形 ， 保 证 程序 员 在 任何 情况 下 都 可 以 正常 调试 计算 机 语言 的 定义 应 该 构造 得 没有 二 义 
性 。 根 据 上 述 关于 二 义 性 的 讨论 ， 我们 给 出 干 面 的 定义 。 
定义 3.5.2 如果 存 在 字符 囊 weL(G)， 使 得 它 在 G 中 邦 在 两 种 不 同 的 最 左 推 导 ， 那 么 上 三 文 无 
关 文 法 G 就 有 二 义 性 (ambiguous) 。 没 有 二 义 性 的 文法 称 作 无 二 义 性 (unambiguous)。 
例 3.5.1 已 知 产生 a’ 的 文法 G 
S—aS | Sa| a 
G 是 二 义 性 的 ， 因 为 字符 串 aa 有 两 种 不 同 的 最 左 推导 : 
S aS S 28a 
—aa —aa. 
语言 a’ 也 可 以 由 非 荆 义 性 的 文法 产生 


S-»aS | a. 


[91 | 





[92 | 
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如 果 文法 是 正则 ， 那 么 它 就 具有 下 面 的 性 质 : 所 有 的 字符 串 都 可 以 从 左 到 右 产生 。 变 量 S 一 直 是 字符 
串 的 最 右 符 号 直到 使 用 规则 So 使 得 递归 停止 为 止 。 [s] 
前 面 的 例子 显示 三 义 性 是 文法 的 性 质 , 而 不 是 语言 的 性 质 。 当 文法 显示 是 二 义 性 的 时 候 ， 通 常 可 
以 构造 与 之 等 价 的 无 二 义 性 的 文法 。 但 这 并 不 是 总 能 够 成 功 的 确实 存在 二 些 不 能 用 无 二 义 性 文法 生 
成 的 上 下 文 无 关 文 法 。 此 种 语言 的 这 种 性 质 叫 做 固有 二 义 性 (inherently ambiguous) 。 大 多 数 编程 语言 
的 语法 ,需要 使 用 无 二 义 性 的 推导 ， 所 以 要 求 严 格 避 免 固 有 二 义 性 3 
例 3.5.2 CA G 是 生成 语言 b'ab' 的 文法 


S—bS| Sb | a. 
最 左 推导 : 
S bS S Sb 
—bSb —bSb 
—bab —bab 


表明 G 是 具有 二 义 性 的 。 这 种 文法 具有 能 够 以 任何 顺序 生成 b 的 能 力 ， 因 此 必须 去 掉 ， 从 而 获得 无 二 
义 性 的 文法 。L( G) 是 使 用 下 面 这 种 无 二 类 性 的 详 法 生成 的 语言 : 
G,: S—bS| aA G,: S—bS| A 
A—bA | 入 A-+Ab | a. 
在 G, 中 ， 最 左 推导 中 应 用 规则 的 顺序 是 完全 由 推导 出 的 字符 串 所 决定 的 。 字 符 串 bab" 的 惟一 "T 
推导 具有 下 面 的 形式 : 
S Sb's 
=>b"aA 
=>b"ab"A 
=>b" ab”. 
G, 的 推导 初始 生成 6, 后 面 跟着 作为 尾部 的 b， 最 后 是 as o 
如 果 最 左 推导 的 每 一 步 ， 只 有 1 rd rap ee 那么 这 种 文法 是 
无 二 义 性 的 。 但 是 这 并 不 意味 着 当时 只 有 一 种 可 以 应 用 的 规则 ， 而 是 应 用 其 他 的 规则 可 能 会 导致 无 法 
生成 期 望 的 字符 串 。 
考虑 使 用 例 3, 5. 2 的 文法 G, 来 构造 字符 串 bbabb 的 最 左 推导 的 可 能 性 。 有 两 条 S 规则 可 以 用 于 初 
始 化 推导 过 程 。 首 先 使 用 规则 $ 一 4 ， 那 么 推导 过 程 将 产生 首 字母 为 WERE. AK, bbabb 的 推导 
过 程 必须 首先 使 用 规则 5S->b5。 第 二 个 b 是 由 同一 条 规则 产生 的 在 此 基础 上 ,推导 过 程 继续 使 用 
SA, SARA Sbs, TIARA bbb, 后 缀 bb 是 使 用 两 次 推导 规则 4 一 4b， 然 后 应 用 推导 规则 
4 一 4 推导 生成 的 s 因为 终结 字符 串 本 身 确定 了 使 用 的 规则 的 准确 顺序 ， 所 以 文法 是 无 二 义 性 的 。 
$/3.5.3. (3.2.4 APE L = {a"b" | 0<n<m<2n} 的 文法 是 有 三 义 性 的 。 字 符 串 aabbb 可 
以 由 下 面 的 推导 得 到 ; 


S =aSb S 2aSbb 
=>aaSbbb —»aaSbbb 
—aabbb —»aabbb. 


无 三 义 性 地 生成 工 中 的 字符 串 的 这 种 策略 是 首先 产生 a, 以 及 一 个 相 匹配 的 ,上 5 然后 生成 一 个 a 和 
两 个 p。 按 照 这 种 方式 生成 工 中 字符 串 的 无 三 义 性 文法 是 
SaSb| A| X D 
A—aAbb | abb. 
推导 树 描述 了 推导 中 变量 的 转换 。 在 最 左 (最 右 ) 推导 和 推导 树 之 间 存 在 一 个 自然 的 一 对 一 对 
应 。 定 义 3.1.4 概述 了 直接 源 于 最 左 推导 的 推导 树 的 构造 过 程 。 相 反 ， 一 个 字符 串 w 的 惟一 最 左 推导 
可 以 从 一 个 边界 为 w 的 推导 树 中 抽取 出 来 。 因为 这 种 对 应 关系 ，“ 义 性 经 常 由 使 用 推导 树 的 术语 来 定 
Mo WIR L(G) 中 的 字符 串 位 于 两 棵 不 同 的 推导 树 的 边界 ， 那 么 文法 G 是 二 义 性 的 。 图 3-3 表明 ， 
3-1 中 给 出 的 字符 串 ababaa 的 两 个 最 左 推导 产生 了 不 同 的 推导 树 。 
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3.6 上 下 文 无 关 文 法 和 编程 语言 定义 


在 前 面 的 小 节 中 ， 我 们 使 用 上 下 文 无 关 文法 ,依靠 仅 有 几 个 元 素 的 字母 表 和 几 条 规则 来 生成 “ 玩 
具 ” 语 言 。 这 些 例子 都 显示 了 上 下 文 无 关 规则 产生 满足 特定 语法 需求 的 字符 串 的 能 力 。 编 程 语言 具有 
很 大 的 字母 表 和 更 复杂 的 语法 ， 并 增加 了 定义 语言 需要 的 规则 的 复杂 性 和 数目 。 高 级 语言 的 第 一 个 形 
式 化 描述 是 John Backus [1959] 和 Peter Naur [1963] 提出 的 ALGOL 60 语言 。Backus 和 Naur 使 用 的 
这 个 系统 称 作 巴克 斯 一 瑙 尔 范 式 (Backus-Naur form 或 者 BNF) 。 编 程 语言 Java 的 规约 就 是 用 BNE 给 
出 的 ， 它 用 来 解释 编程 语言 语法 定义 的 原则 。 附 录 IV 给 出 了 Java 的 完整 形式 化 定义 。 

语言 的 BNF 描述 就 是 土 下 文 无 关 文 法 。 它 们 惟一 的 区 别 是 用 来 定义 规则 的 表示 法 不 同 。 我 们 将 
使 用 上 下 文 无 关 表 示 给 出 规则 如 当然 除了 一 点 例外 。 变 量 或 终结 符 后 面 的 下 角 标 opt 表明 它 是 可 选 的 。 
这 种 表示 减少 了 需要 写 出 的 规则 的 数目 ， 但 是 带 有 可 选 构成 成 分 的 规则 可 以 很 容易 地 转化 成 等 价 的 上 
下 文 无 关 规则 。 例 如 ，4 一 Bu 和 AB, C 可 以 分 别 用 规则 4-*B| 入 和 4-*BC|'C 代替 。 

Java 规则 中 使 用 的 表示 习惯 与 本 章 开始 时 所 给 出 的 例子 中 的 自然 语言 是 一 样 的 。 变 量 的 名 字 指 的 
是 它们 产生 的 语言 的 构成 成 分 ， 并 且 把 这 个 名 字 放 在 〈《》 Po Java 关键 词 使 用 粗 体 ， 其 他 的 终结 符号 
使 用 字符 串 ， 中 间 用 空格 表示 。 

编程 语言 的 设计 和 复杂 程序 的 设计 类 似 ， 是 使 用 模块 化 来 分 别 构造 文法 的 子 集 ， 从 而 得 到 简化 了 
的 设计 过 程 。 在 构造 小 规则 集中 使 用 的 技巧 ， 也 可 以 用 于 设计 具有 复杂 语法 的 大 型 语言 的 文法 。 这 些 
技巧 包括 使 用 规则 保证 成 员 的 存在 ， 成 员 的 相对 位 置 ， 或 是 使 用 递归 生成 序列 ， 或 生成 成 对 的 括号 。 

为 了 解释 设计 语言 的 原则 ， 我 们 考察 定义 Java 中 常量 、 标 识 符 和 算术 表达 式 的 规则 。 常 量 和 具有 
固定 类 型 和 值 的 字符 串 常常 被 用 来 初始 化 变量 ， 从 而 为 重复 的 语句 设置 界限 ， 储 存 标准 信息 用 以 输 
出 。 变 量 〈Ziteral》 的 规则 定义 了 Java 常量 的 类 型 。Java 常量 以 及 产生 它们 的 变量 如 下 表 所 示 : 





* B z 量 95 F 

Boolean ( BooleanLiteral) true , false 

Character ( CharacterLiteral) 'a^ Ww (HITR), or’, 

String (StringLiteral) ""( 238), 
"This is a nonempty string" 

Integer (Integer Literal) 0,356,1234L ( KA) ,077( 八 进 制 ) , 
0xlab2( 十 六 进 制 ) 

Floating point ( Floating Point Literal) 2. ,.2,2. 0,12. 34,2e3,6. 2e-5 

Null (NullLiteral) null 


每 个 浮 点 常量 都 有 f，F,d 或 D 来 作为 后 级 表示 它 的 准确 度 。 完 整 的 Java 常量 集合 定义 参见 附录 IV 
中 的 规则 143 - 167。 
我 们 进一步 考虑 定义 浮 点 常量 的 规则 ， 因 为 它们 含有 最 有 趣 的 语法 变量 。 四 个 (FloatingPointLit- 
eral〉 规 则 指定 了 浮 点 常量 的 通用 形式 。 
( FloatingPoiniLiteral) —( Digits). ( Digits) ,,,( ExponentPart) ,,,( FloatTypeSuffix) „ | 
. (Digits) ( ExponentPart) ,,,( FloatTypeSuffix) s | 
( Digits) ( ExponentPart) ( FloatTypeSuffix) ,,, | 
( Digits) ( ExponentPart ).,,, ( FloatTypeSuffix) 
ARE (Digits), (ExponentPart) Wü (FloatTypeSuffix) 产生 了 组 成 常量 的 构成 成 分 。 变 量 〈Dis- 
its) 使 用 递归 产生 了 数字 字符 串 。 非 递归 规则 保证 了 至 少 一 个 数字 的 存在 。 
( Digits) —( Digit) | ( Digits) ( Digit) 
( Digit) — 0 | ( NonZeroDigit) 
(NonZeroDigit) —1| 2|3|4|5|6| 7] 8/9 
( ExponentPart) —( ExponentIndicator) ( SignedInteger) 
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( ExponentIndicator) — e | E 
(SignedInteger) —(Sign) ,,,( Digits) 
(Sign) + | = 
(FloatTypeSuffix) — f| F| d| D 
规则 (SignedInteger) —(Sign) „< Digits) WPH opt 表示 一 个 带 符 号 的 整数 可 以 是 由 + 或 -开始 ， 
但 是 符号 不 是 必须 的 。 
第 一 条 《FloatingPointLiteral》 规则 产生 了 形 如 1. ,1.1, 1.1e, Le, 1.1ef, 1:f, 1.1.f 和 1.ef 
的 常量 。 具 有 数字 和 十 进 制 点 的 领头 字符 串 是 必须 的 ， 所 有 其 他 的 构成 成 分 是 可 选 的 。 第 二 条 规则 产 
生 了 以 十 进 制 点 开始 的 常数 ， 而 最 后 两 条 规则 定义 了 没有 十 进 制 点 的 浮 点 常数 。 
标识 符 用 来 定义 变量 、 类 型 和 方法 等 的 名 字 。 标 识 符 使 用 下 面 的 规则 定义 : 
(Identifier) —( IdentifierChars) ; 
(AdentifierChars) —(JavaLetter) | (JavaLetter) ( JavaLetterOrDigit) 
其 中 ，Java 字母 包括 字母 从 A 到 Z， 从 a 到 z， 下划线 _ 和 美元 符号 $ ， 以 及 其 他 用 Unicode 编码 的 
字符 。 
Java 中 的 语句 的 定义 开始 于 变量 (Statement) : 
(Statement) —(StatementWithoutTrailing Substatement) | ( LabeledStatement) | 
(IfThenStatement) | (IfThenElseStatement) | 
( WhileStatement) | ( ForStatement). 
没有 子 语句 的 语句 包括 块 ， 和 do 语句 与 switch 语句 。 附 录 IV 中 的 规则 73 -75 给 出 语句 的 整个 集合 。 
与 常量 的 规则 类 似 ， 语 句 规则 定义 了 语句 的 高 层 结构 。 例 如 ， 让 then 和 do 语句 是 由 下 面 来 定义 的 
(IfThenStatement) —if( ( Expression) ) ( Statement) 
( DoStatement) —do( Statement) while( ( Expression) ) 
AERE (Statement) 出 现在 前 面 规则 的 右 侧 ， 从 而 生成 了 让 then 语句 中 的 条 件 语句 之 后 ， 和 do 循环 体 
中 的 执行 的 语句 。 
表达 式 是 评估 是 数字 计算 和 检查 让 then do, while 和 switch 语句 的 关键 。 表 达 式 的 语法 是 使 用 附 
ak IV 中 的 规则 118 -142 来 定义 。 语 法 很 复杂 ， 因 为 Java 具有 数字 表达 式 和 布尔 表达 式 ， 它 们 可 能 使 ， 
用 后 缀 操作 符 、 前 绥 操 作 符 或 是 中 组 操作 符 。 除 了 描述 这 些 单独 的 规则 外 ， 我 们 还 将 看 看 出 现在 简单 
数学 赋值 的 推导 过 程 中 存在 的 几 个 子 推导 。 
BFE (Expression) 转化 成 一 个 赋值 句 。 
( Expression) =< AssignmentExpression) 
=> ( Assignment) 
—(LeftHandSide) ( AssignmentOperator) ( AssignmentExpression ) 
—(ExpressionName) ( AssignmentOperator) ( AssignmentExpression) 
=> (Identifier) ( AssignmentOperator) ( AssignmentExpression 》 
—( Identifier) = ( AssignmentExpression) . 
下 一 步 就 是 由 〈AssignmentExpression〉 推导 出 (AdditiveExpression) , 
(AssignmentExpression) = ConditionalExpression) 
=>( ConditionalOrExpression) 
=> ( ConditionalAndExpression ) 
=>( InclusiveOrExpression ) 
=>( ExclusionOrExpression ) 
=>(AndExpression) 
=>( EqualityExpression) 
=> ( RelationalExpression) 
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—(ShiftExpression ) 
—(AdditiveExpression) . 
HH (AdditiveExpression) 开始 的 推导 产生 形式 正确 的 带 有 加 法 操作 符 、 乘 法 操作 符 和 括号 的 表达 式 。 
比如 ， 
( AdditiveExpression) = ( AdditiveExpression) + ( MultiplicativeExpression) 
=> ( MultiplicativeExpression) +  MultiplicativeExpression) 
=>( UnaryExpression) + ( MultiplicativeExpression) 
=>( Identifier) + ( MultiplicativeExpression) 
= (Identifier) + (MultiplicativeExpression) * ( MultiplicativeExpression) 
开始 了 这 样 一 个 推导 。 由 《LVmnaryExpression》 开始 的 推导 能 够 产生 常数 、 MARGRET S 
( (Expression) ) 。 
这 些 定 义 了 标识 符 、 常 量 和 表达 式 的 规则 显示 了 大 型 语言 的 设计 是 如 何 分 解 成 语言 中 经 常 出 现 的 
TRKA. SE (Identifier), (Literal) 和 《Expression〉 为 高 层 规则 构造 了 模块 。 
文法 的 开始 符 是 《CompilationUnit) , Java 程序 的 推导 源 于 规则 


( CompulationUnit) —.( PackageDeclaration) ,,( ImportDeclarations) 


( TypeDeclarations) od j 
由 这 条 规则 推导 出 的 终结 符 构成 的 字符 串 是 语法 正确 的 Java 程序 。 
3.7 练习 
1. BAG ENE 
S—abSc | A 
A-+cAd | cd. 


a) 给 出 ababccddcc 的 推导 。 
b) 给 (a) 中 推导 过 程 构造 的 对 应 的 推导 树 。 
c) 使 用 集合 表示 来 定义 L(G)。 


2. EA GENE 
S—ASB | 入 
A—aAb | ^ 
B—bBa | ba. 
a) 给 出 aabbba 的 最 左 推导 。 
b) 给 出 abaabbbabbaa 的 最 右 推导 。 
c) 构造 (a) Al (b) 中 推导 对 应 的 推导 树 。 
d) 使 用 集合 表示 法 来 定义 L(G)。 
3. BAG BMH 
S—SAB | X 
A—aA | a 
B-+bB| 入 . 
a) 给 出 abbaab 的 最 左 推导 。 
b) 给 出 aa 的 两 种 最 左 推导 。 s 
c) 构造 (b) 中 推导 对 应 的 推导 树 。 al Dur. 
d) 给 出 L(G) 的 正则 表达 式 。 
4. 已 知 DT 是 推导 树 ee e at 
a) 给 出 产生 树 DT 的 一 个 最 左 推导 。 | | | 
b) 给 出 产生 树 DT 的 一 个 最 右 推导 。 a a b 


c) 有 多 少 个 产生 DT 的 不 同 的 推导 。 
5. 给 出 图 3-3 中 每 个 推导 树 的 最 左 和 最 右 推导 。 
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- 对 于 下 面 的 每 种 上 下 文 无 关 文法 ， 使 用 集合 表示 来 定义 这 些 文法 产生 的 语言 。 


a) S—aaSB | X b) S—aSbb|A 
B—bB|b A—cA | c 
c) SabSdc|A d) S—aSb|A 
A—cdAba | X A—.cAd | cBd 
B—aBb | ab 
e) S—a$B | aB 
B—bb|b 


. 构造 1a,b,c| KiB la bc" | n,m>0} 的 文法 。 

. 构造 |a,b,c| HER la bc" | n,m>0| 的 文法 。 

. H a,b,c} 上 语言 ia"b"c' | On e msil CH. 

. 构造 1a,b|} EER la" b" | 0<n<m<3n!} 的 文法 。 

. {a,b} 上 语言 1a”"b'a" |i=m+n| 的 文法。 

. Tak a,b] 上 包含 相同 数目 a Ab 的 字符 串 的 语言 的 文法 。 
. 构造 1a,b| 上 长 度 为 奇数 ， 并 且 字 符 串 的 首位 和 中 间 位 置 具 有 相同 字符 的 字符 串 构 成 的 语言 的 文法 。 
. 对 于 下 面 每 种 正则 文法 ， 给 出 它们 产生 的 语言 对 应 的 正则 表达 式 。 


a) S—aA b) S—aA 
A—aA | bA | b A—aA | bB 
B—bB|X 
c) Sas | bA d) $—a$| bA| X 
A—>bB A—aA | bS 
B—aB | X 


从 练习 15 到 练习 25 ， 分 别 给 出 产生 相应 语言 的 正则 文法 。 


.|a,p,cl 的 字符 串 ， 其 中 ， 所 有 a 发生 在 b 的 前 面 ,这 些 都 出 现在 c 的 前 面 。 可 以 存在 没有 a, b, 或 者 


BA c 的 情况 。. 


. la,b| 上 包含 子 串 aa 和 bb 的 字符 串 的 集合 。 

- (a,b) EFE aa 至 少 出 现 两 次 的 字符 串 的 集合 〈 提 示 : 注意 字符 串 aaa), 
. |a,b| 上 包含 子 串 ab 和 ba 的 字符 串 的 集合 。 

- {a,b} E a 的 个 数 可 以 被 3 整除 的 字符 串 的 集合 。 

(a,b) EFIE, a 要 么 紧 跟 在 b BI, ZA RRE b 的 后 面 。 例 如 ，baab，aba Fil b. 
- |a,b| 上 不 包含 子 串 aba 的 字符 串 的 集合 。 

. la,b] EFE aa 只 出 现 一 次 的 字符 串 的 集合 。 

. |a,b| 上 只 包含 两 个 b 的 字符 串 的 集合 。 

. la,b,c| 上 子 串 ab 出 现 的 次 数 是 奇数 的 字符 串 的 集合 。 
{a,b} LAAT a, 或 者 有 奇数 个 b 的 字符 串 的 集合 。 
- 图 3-1 中 的 文法 产生 了 (b"ab" ab )'， 它 是 所 有 具有 正 偶数 个 a 的 字符 串 的 集合 。 证 明 这 个 结论 。 
. 证 明 例 3. 2. 2 中 给 出 的 文法 确实 产生 了 期 望 的 语言 。 








. 已 知 G 是 文法 
S—aSb | B 
B—>bB | b. 
证 明 L(G) = |a" b" | Ozn«m| , 
已 知 G 是 文法 
S—aSaa | B 
B—bbBdd | C 
C—bd. 


a) 什么 是 L(G)? 
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“30. 


31. 
32. 


33. 


34. 


95. 


36. 


3T. 


38. 
* 39. 








b) 证 明 L(G) 是 (a) 给 出 的 集合 。 
已 知 G 是 文法 

S—aSbS | aS | x. 
TERA L(G) 的 字符 串 的 每 个 前 绥 a 的 个 数 不 少 于 bo 
已 知 G 是 上 下 文 无 关 文 法 ， 并 且 weL(G)。 WH G 中 的 w 存在 最 右 推导 。 
已 知 G 是 文法 

S—aS | Sb | ab. 

a) 给 出 L(G) 的 正则 表达 式 。 
b) 构造 字符 串 aabb 的 两 种 最 左 推导 。 
c) 构造 (b) 中 推导 过 程 对 应 的 推导 树 。 
d) 构造 等 价 于 G 的 无 二 义 性 文法 。 
对 于 下 面 每 种 文法 ， 给 出 相应 文法 的 语言 的 正则 表达 式 或 集合 论 定 义 。 证 明文 法 是 二 义 性 的 ,并 给 出 


相应 的 无 二 义 性 文法 。 


a) $—aaS | aaaaaS | X b) S—aSA | X 
A—bA | X 
c) S—aSb | aAb d) S$—4AaSbB | X 
A—cAd | B A—aA | a 
B—aBb | X B—bB|A 
*e) S>A| B 
A—abA | X 
B—aBb | X 
已 知 文法 
$—aA | 入 
A—aA | bB 
B—BB | b. 
a) 给 出 L(G) 的 正则 表达 式 。 
b) 证 明 G 是 无 二 义 性 的 。 
已 知 文法 G 是 
S—aS|aA|a 
A—aAb | ab. 
a) 给 出 L(G) 的 集合 论 定义 。 
b) 证 明 G 是 无 二 义 性 的 。 
已 知 文法 G 是 
7 S—>aS| bA| X 
A—>bA | aS | X. 


给 出 L(G) 的 正则 表达 式 。G 是 二 义 性 的 吗 ? 如 果 是 ,给 出 产生 L(G) 的 无 二 义 性 文法 。 如 果 不 是 ， 请 
证 明 。 

为 语言 L = (a" b"c" | n,m>0} AL, = {a"b"c™ | n,m>0| 构 造 无 二 义 性 文法 。 构 造 产生 LUL, 的 文法 Go 
证 明 G 是 二 义 性 的 。 这 是 具有 固有 二 义 性 的 语言 的 一 个 实例 。 给 出 直观 的 解释 ,为 什么 产生 L UL, 的 每 
个 文法 都 是 有 二 义 性 的 。 

使 用 附录 IV 中 的 Java fe MARIE (Literal) 来 构造 字符 串 1. 3e2 的 推导 。 

已 知 G, 和 G, 是 下 面 的 文法 


G,: S—aABb G,: S—AABB 
A—aA|a A—AA | a 
B—>bB | b B—BB | b. 
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101 证 明 L(G) SL(G, Jio 
b) 证 明 L(G,) =L(G,). 
*40. 





a) 对 于 每 个 变量 X， 证 明 G, 人 G, 由 对 应 的 变量 X 推 导出 。 使 用 这 点 来 
i) Aw, 或 者 
ii) A—wB 
41. 
42. 


右 线性 文法 (right-linear grammar) 是 上 下 文 无 关 文 法 ， 它 的 每 条 规则 都 至 少 有 下 面 的 形式 之 一 
其 中 ，we %“。 证 明 语 言 L 是 由 右 线性 文法 产生 的 ， 当 和 且 仅 当 它 可 以 由 一 种 正则 文法 生成 。 
试 着 构造 产生 语言 |a"b" | n>0} 的 正则 文法 。 解 释 为 什么 你 的 尝试 无 法 成 功 。 
试 着 构造 产生 语言 1a"b"c" | n=0| 的 上 下 文 无 关 文法 。 解 释 为 什么 你 的 尝试 无 法 成 功 。 
参考 文献 注释 
上 下 文 无 关 文 法 是 Chomsky [1956], [1959] 提出 的 。 巴 克 斯 一 瑞 尔 范式 是 由 Backus [1959] 
提出 的 。 这 些 形式 都 曾 用 来 定义 变 成 语言 ALGOL， 参 见 Naur [1963] 。 附 录 IV 中 给 出 了 Java 的 BNF 
定义 。Ginsburg 和 Rice [1962] 记录 了 BNF 定义 的 语言 和 上 下 文 无 关 语 言 的 等 价 性 。 
Floyd [1962], Cantor [1962] 以 及 Chomsky 和 Schutzenberger [1963] 都 考查 了 二 义 性 这 种 性 
质 。 练习 37 中 的 语言 是 固有 二 义 性 的 证 明 可 参考 Harrison. [ 1978 ]。 
[102] 19660] 构造 了 二 义 性 和 固有 二 义 性 的 语言 的 封闭 性 质 。 


Ginsburg 和 Ullian [ 1966a 


第 4 章 ， 上 下 文 无 关 文 法 范式 


上 下 文 无 关 文法 的 定义 允许 规则 右 侧 的 形式 无 限 灵 活 。 这 种 灵活 性 对 于 设计 文法 非常 有 益 ， 但 是 
由 于 上 下 文 无 关 文法 缺乏 结构 性 ， 因 此 使 得 我 们 很 难 在 文法 、 推 导 和 语言 之 间 建 立 一 般 的 联系 。 上 下 
文 无 关 文 法 范式 在 文法 的 基础 上 加 入 了 结构 上 的 限制 ,使 得 上 下 文 无 关 文法 和 语言 的 分 析 变 得 更 容 
易 。 范 式 有 两 个 特点 : 

i) 满足 范式 的 文法 就 可 以 生成 整个 上 下 文 无 关 语 言 。 

ii) 存在 一 个 算法 ， 可 以 将 任意 上 下 文 无 关 文法 转化 为 与 其 等 价 的 上 下 文 无 关 文法 范式 。 

本 章 我 们 介绍 了 两 种 重要 的 上 下 文 无 关 文法 范式 ， 乔 姆 斯 基 范 式 和 格 立 巴赫 范式 。 我 们 也 给 出 了 
任意 上 下 文 无 关 文法 转换 成 它们 的 方法 。 这 些 转 换 过 程 包括 规则 的 修改 以 及 增删 等 操作 ， 每 个 操作 都 
保持 最 初 文法 生成 的 语言 不 变 。 

范式 确保 了 文法 的 推导 满足 一 定 的 条 件 。 乔 姆 斯 基 范 式 文法 的 推导 树 是 二 又 树 。 在 第 7 章 ， 我 们 会 
利用 二 又 树 的 深度 和 叶子 数 的 关系 来 确保 一 个 上 下 文 无 关 诸 言 中 存在 重复 的 模式 。 我 们 也 会 利用 乔 姆 斯 
基 范 式 文法 里 推导 的 特性 来 设计 高 效 的 算法 ， 并 用 于 判断 一 个 字符 串 是 否 属于 某 个 文法 描述 的 语言 。 

格 立 巴赫 范式 文法 的 推导 采用 从 左 到 右 的 方式 来 构造 字符 串 。 每 条 规则 为 推导 字符 串 添 加 一 个 终 
结 符 。 在 第 7 章 中 我 们 会 用 格 立 巴赫 范式 来 为 上 下 文 无 关 语言 建立 基于 机 器 的 特征 。 


4.1 文法 转换 


一 个 文法 到 范式 的 转换 是 国 一 系列 规则 的 增 、 删 、 改 构成 的 。 每 一 次 修改 都 不 改变 文法 对 应 的 语 
言 。 每 一 步 的 目标 都 是 产生 满足 某 些 性 质 的 规则 。 这 些 转换 的 顺序 是 为 了 确保 接 下 来 的 每 一 步 转换 ， 
都 仍然 保持 前 面 步 台所 产生 的 性 质 。 

第 一 个 转换 非常 简单 。 我 们 的 目标 是 限制 文法 初始 符号 对 推导 过 程 初始 化 的 影响 。 如 果 文法 的 开 
始 符 是 递归 变量 ， 那 么 8 二 usy 形式 的 推导 使 得 文法 开始 符 始终 出 现在 每 一 次 推导 的 句 型 中 。 对 于 每 
个 文法 G， 我 们 可 以 找到 一 个 等 价 文法 G'， 在 G' 中 ， 文 法 开始 符 不 是 递归 的 。G 和 G' 的 文法 的 开始 
符 并 不 一 定 是 一 样 的 。 虽 然 转 换 过程 很 简单 ， 但 是 这 个 转换 过 程 显示 出 ， 必 须 存在 步骤 来 证 明 转 换 并 
没有 修改 原文 法 的 语言 。 

引 理 4.1.1 设 G=(V, 且 ,P,S) 是 一 个 上 下 文 无 关 文 法 ， 存在 一 个 文法 G 满足 

i) L(G) =L(G'). 

ii) G' 的 开始 符 不 是 递归 变量 。 

证 明 : 如 果 G 的 开始 符 S 并 没有 出 现在 G 的 任意 一 个 推导 规则 的 右 侧 ,那么 G=G'。 如 果 5 是 一 
个 递归 变量 ， 那 么 使 它 产生 递归 的 规则 必须 被 去 掉 。 我 们 可 以 采用 “ 回 退 ” 的 方法 。 构 建 一 个 新 文法 
G'=(VU1S,Z,PU1S 一 81 ,8 )。 我 们 用 8 来 代 蔡 S， 在 规则 集中 加 入 规则 5'-S。 这 两 种 文法 产 
生 的 语言 完全 相同 。 因 为 任意 一 个 可 以 从 G 推导 出 来 的 字符 串 w， 即 Sdu, HUES S S5 Su 


中 获得 。 而 且 ， 新 添加 的 规则 惟一 的 作用 是 初始 化 G' 的 推导 。 因 此 G' 中 推导 出 来 的 字符 串 也 可 以 从 ”[104] 


G 中 推导 出 来 。 E 
例 4.1.1 G 的 开始 符 
G: S—aS| AB | AC Gie S'S 
A—aA | X S—aS | AB | AC 
B—>bB | bS A—aA | X 
C—cC| X B—BbB | bS 


Cc] X 
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是 递归 的 ， 我 们 用 引 理 4. 1. 1 中 介绍 的 方法 构建 了 等 价 文法 G'。G' 的 开始 符 是 8'，S' 不 是 递归 的 。G' 
中 变量 S 仍然 是 递归 的 ， 但 是 它 已 经 不 是 开始 变量 了 。 Bs 

文法 转换 到 范式 的 过 程 包含 规则 的 增加 和 删除 。 每 一 步 的 变化 都 不 应 该 修改 文法 产生 的 语言 。 引 
理 4.1.2 介绍 了 如 何 保证 增加 规则 也 不 会 改变 语言 本 身 。 引 理 4. 1. 3 介绍 了 如 何 删除 规则 。 删 除 一 条 
规则 的 同时 ， 显 然 必须 增加 新 的 规则 ， 和 否则 语言 就 会 改变 。 

584.12 i G-(V,X,P,S) —A.ET XXX, hU Aw, HRZGkG' -(V,X,PU 
[Aw] ,S) fe G 等 价 。 

证 明 : 很 明显 L(G) CL(G'), ， 这 是 因为 G 中 每 一 条 规则 都 在 GR, Wi L(G’) EL(G) 是 因为 G' 
中 规则 Aw 导出 的 串 也 可 以 由 4 ow 导出 。 本 

引 理 4.1.3 i G-(V,X,P,S))E —ETXXEX3k, AOuBv 是 P 中 一 条 规则 。 而 且 Bo 
w| w |…| w, 是 P 中 的 规则 。 文 法 G' =(V,D,P',S), KP 

P' = (P - |A—uBv] ) U|A—uwv | uw,v | …| uw,v] 

和 G 等 价 。 

证 明 : 既然 每 条 规则 A—uw,v 都 是 可 以 从 G 推导 出 来 的 ,那么 根据 引 理 4. 1.2, L(G’) CL(G), 

另 一 方面 ，G 中 使 用 规则 A—uBv 推导 出 来 的 终结 符 串 也 可 以 从 G' 中 推导 出 来 。 使 用 这 条 规则 推 
导出 的 终结 符 串 的 最 右 推导 过 程 如 下 : 

S SpAq-puBvq pxBvq—pxw,vq >w, 

这 里 Sx 将 二 转 为 一 个 终结 符 串 。 这 个 串 可 以 在 G' 使 用 规则 A—uw,v 产生 : 


S SpAq-»puw,vq 2»pxw,vq >w. E 
4.2 消去 入 规则 


在 终结 符 串 的 推导 过 程 中 ， 中 间 串 可 以 包含 那些 不 会 产生 终结 符 的 变量 。 这 些 变量 可 以 用 入 规则 
去 掉 。 我 们 可 以 从 以 下 文法 中 推导 出 串 aaaa: 
S—SaB | aB 
B—BB | 4. 
从 这 个 文法 中 产生 的 语言 是 (ab')'. aaaa 是 根据 第 二 条 规则 生成 的 。 每 产生 一 个 B， 就 可 以 用 Bon 
M. S —SaB 
—9SaBaB 
—SaBaBaB 
—aBaBaBaB 
—aaBaBaB 
—aaaBaB 
—aaaaB 
=>aaaa. 
我 们 下 一 个 转换 过 程 的 目标 就 是 确保 句子 里 的 每 一 个 变量 都 产生 终结 符 串 中 的 终结 符 。 在 上 面 的 
例子 中 ， 没 有 一 个 如 产生 终结 符 。 一 个 更 加 有 效 的 方法 是 避免 产生 那些 会 被 入 规则 消去 的 变量 。 
语言 (ab* ) * 可 以 由 这 个 文法 产生 : 
S—SaB | Sa| aB | a 
B—bB|b 
这 个 文法 没有 入 -规则 。 串 aaaa 的 推导 过 程 如 下 : 
S sa 
=Saa 
=Saaa 
—aaaa , 
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这 个 推导 过 程 只 使 用 了 前 面 推导 规则 的 一 半 ， 这 种 效率 的 获得 是 以 文法 规则 数目 的 增加 为 代 
价 的 。 
推理 过 程 中 入 规则 Boa 不 仅仅 影响 变量 B。 看 看 这 个 文法 : 
S—-aAb 
A—aA | B 
B—BB | x. 
RPE EI zi a'b'. BEA 出 现在 字符 串 ab 的 推导 过 程 中 ， 但 是 接 下 来 使 用 了 规则 AB, 3 
有 产生 终结 符 。 
S —aAb 
—aBb 
—ab. 
只 要 一 个 变量 可 以 产生 空 串 ， 就 像 4， 那 么 它 就 可 能 不 产生 终结 符 。 我 们 将 这 种 可 以 产生 空 串 的 变量 
叫做 可 空 变量 (nullable) 。 如 果 句 子 中 包含 一 个 可 空 变量 ， 那 么 句子 的 长 度 可 能 会 减少 。 
下 面 介绍 消去 入 -规则 的 方法 。 消 去 过 程 包含 三 步 
1. 确定 可 空 变 量 。 
2. 去 掉 出 现 了 可 空 变量 的 规则 。 
3. 去 掉 入 -规则 。 
如 果 一 个 语法 没有 可 空 变量 ,那么 推导 中 出 现 的 每 一 个 变量 都 会 产生 终结 符 。 这 样 使 用 规则 就 不 会 缩 
短 句子 的 长 度 。 这 样 的 文法 称 为 非 收缩 性 (noncontracting) 的 。 
消去 过 程 的 第 一 步 是 确定 可 空 变量 集 。 可 以 使 用 算法 4.2. 1 递归 地 从 入 -规则 中 获得 可 空 变量 集 。 
这 个 算法 使 用 了 两 个 集合 : NULL 集合 是 可 空 变 量 集 ，PREV 集合 是 上 次 迭代 过 程 中 得 到 的 可 空 变量 
集 ， 它 是 触发 算法 的 停止 条 件 。 


算法 4.2.1 
可 空 变量 集 的 构造 
WA: EFEK G = (VIPS) 
1. NULL: = |A| 4A—A e P] 
2. repeat 
2. 1. PREV: = NULL 
2.2. for (3$ A e V do 
证 存在 一 个 4 规则 A—w H we PREV", then 
NULL: -NULLU {A} 
until NULL = PREV 








NULL 集合 首先 由 那些 直接 产生 空 串 的 变量 组 成 。 如 果 某 个 规则 中 左边 是 变量 4， 右 边 由 NULL 
集合 中 的 变量 构成 ,那么 A 就 被 加 到 NULL 集合 中 。 如 果 算法 无 法 找到 新 的 变量 4， 那么 算法 就 停止 
了 。 既 然 变量 的 数目 是 有 限 的 ， 那 么 算法 就 必然 会 停止 。 可 空 变量 的 定义 依赖 于 推导 的 表示 ， 它 是 递 
归 的 。 因 此 ， 可 以 用 归纳 法 来 证 明 NULL 集合 中 包含 的 都 是 计算 结束 时 G 中 的 可 空 变量 。 

引 理 4.2.2 设 G=(V, 甩 ,P,S) 是 上 下 文 无 关 文 法 。 算 法 4.2.1 产生 的 是 G 的 可 空 变量 集合 。 

WEBB: 用 归纳 法 证 明 NULL 中 的 每 个 变量 都 会 产生 空 串 。 如 果 A 在 第 一 步 被 加 入 到 NULL, 那么 
G 包含 规则 4A 一， 因此 A 可 以 推导 出 空 串 。 

假设 经 过 nn KERZE NULL 中 包含 的 变量 都 是 可 空 的 。 我 们 必须 证 明 在 第 n+1 次 迭代 过 程 中 
新 加 入 的 变量 也 是 可 空 的 。 如 果 4 是 这 样 一 个 变量 ,那么 就 存在 这 样 一 个 规则 : 

A—>A, A,A, 
每 个 4; 都 在 PREV 中 。 根 据 归 纳 假设 ，4, 二 和 i=1,2,…,K。 根 据 这 些 推导 ,有 
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A, 
>, 
可 见 4 是 可 空 变量 。 现 在 我 们 来 证 明 所 有 的 可 空 变 量 都 在 NULL Po WR n 是 从 A 推导 出 空 串 的 
最 小 推导 次 数 ， 那 么 A 就 在 第 n 次 迭代 或 者 第 n 次 之 前 被 加 入 到 NULL 中 。 使 用 归纳 法 对 A 推导 出 空 
串 的 推导 次 数 进行 归纳 。 
如 果 A A, 那么 4 在 第 一 步 被 加 入 到 NULL。 假设 所 有 最 小 推导 次 数 小 于 等 于 n 的 变量 都 在 第 n 
次 或 者 第 nn 次 之 前 加 入 到 NULL 中 了 。 设 4 是 最 小 推导 次 数 为 n+1 的 可 空 变量 。 推 导 过 程 为 : 
A SA,A,A, 
SSN. 
每 个 变量 A, 都 是 最 小 推导 次 数 小 于 等 于 n 的 可 空 变量 。 根 据 归纳 假设 , 每 个 4, 都 在 前 n+1 005 
代 被 加 入 到 NULL, BE msn, 假设 所 有 的 A; 都 在 第 m 次 迭代 时 第 一 次 被 加 入 到 NULL。 那 么 在 第 
m+1 次 迭代 ， 因 为 下 面 这 条 规则 ，A 也 被 加 入 到 NULL 中 了 。 " 
A—A,A, 7A, 
由 某 个 文法 产生 的 语言 包含 空 串 ， 那 么 这 个 空 串 就 能 由 文法 的 开始 符 推导 出 来 ， 也 就 是 说 ， 开 始 
符 是 可 空 的 。 因 此 ， 算 法 4. 2. 1 提出 了 一 种 方法 ,来 判断 某 个 文法 的 语言 中 是 否 包括 空 串 。 
例 4.2.1 文法 G 的 可 空 变量 集 可 以 由 算法 4.2.1 获得 。 





G: S—ACA 

A—aAa| B| C 

B—bB| b 

C—cC| N 
我 们 可 以 通过 每 次 迭代 后 NULL RAI PREV 集 的 元 素来 详 — Suk NULL PREY 
细 叙 述 算法 的 执行 过 程 。 第 0 次 迭代 的 NULL 值 就 是 循环 0 1C 
之 前 的 值 . 经 过 三 次 闪 代 ， 算 法 终止 了 。G 的 可 空 变量 集 包 1 Jci gl 
ES ARC 既然 开始 符 是 可 空 的 ， 那 么 L(G) 中 包含 2 ESO MOL 


ZB. Li ee CE T 
含有 入 -规则 的 语法 不 是 非 收缩 性 文法 。 要 建立 一 个 等 价 的 非 收缩 性 文法 ， 需 要 加 入 一 些 规 则 。 
这 些 规 则 是 用 来 生成 那些 原来 要 靠 和 -规则 才能 生成 的 字符 串 。 在 规则 4 一 *uBv 的 作用 下 ， 可 空 变量 B 
可 以 有 两 个 作用 : 它 可 以 生成 一 个 非 空 终结 符 ， 或 者 产生 空 串 。 在 本 例 中 ， 可 以 这 样 推导 ; 
A —uBv 
>uv 
ae 
字符 串 w 可 以 不 靠 和 -规则 生成 ， 而 只 要 在 文法 中 加 入 规则 A—uv. 9188 4. 1. 2 保证 了 加 入 这 个 规 
则 不 会 影响 文法 产生 的 语言 。 
规则 A 一 BABa 要 增加 三 个 规则 ， 才 能 不 青 需 要 A- 规则。 如 果 规 则 右 侧 的 两 个 B ABP AEs EB HB 
么 需要 加 入 规则 4-*4a。 如 果 要 建立 二 个 非 限定 性 文法 ， 一 共 需 要 4 条 规则 才能 产生 所 有 由 规则 4 一 
BABa 产生 的 串 。 
. A—GBABa 
A—ABa 
A—BAa 
A—Aa 
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既然 这 些 规则 的 右 侧 都 是 由 4 推导 出 的 ， 那 么 加 入 这 些 规则 就 不 会 影响 文法 的 语言 。 

这 种 方法 可 以 用 来 把 一 个 文法 G 转换 成 不 包含 -规则 的 等 价 文法 。 如 果 L(G) 包 含 空 串 ， 那么 就 
没有 等 价 的 非 限 定性 文法 。 在 推导 SS 的 过 程 中 ， 所 有 出 现 过 的 变量 最 终 必 然 被 消去 了 。 为 了 处 理 
这 种 情况 ， 可 以 将 规则 Sy 加 入 到 新 文法 中 ,但 是 其 他 所 有 的 -规则 都 被 取代 了 。 如 果 不 考虑 S=> 和 A 
的 情况 ， 这 个 推导 是 非 收 缩 的。 满足 这 些 条 件 的 文法 被 称 为 本 质 上 非 收 缩 性 文法 (essentially noncon- 
tracting ) 。 

构造 等 价 文法 的 时 候 ， 在 文法 下 面 加 下 标 ， 以 示 区 别 。 文 法 G ABR 入 -规则 的 对 等 文法 表示 为 Go 

定理 4.2.3 设 G=(V, 二 ,P;8$) 有 是 一 个 上 下 文 无 关 文 法 。: 存 在 构造 上 下 文 无 关 文 法 G -(V,X, 
Pi ,S51 ) 的 算法 。G, 满足 下 列 条 件 : 

i) L(G,) =L(G), 

ii) S, 不 是 一 个 递归 变量 。 

ii) 如 果 入 seL(G) ， 那 么 除了 Sor, G 不 包含 入- 规则。 否则 Gi 不 包含 任何 入 -规则 。 

证 明 : 开始 符 可 以 通过 引 理 4. 1. 1 来 变 成 非 递 归 变 量 。 如 果 引 入 了 新 的 开始 符 ， 变 量 集合 Vi TX 
仅 是 V 加 上 新 的 开始 符 ， 否则 V, V 一 样 。G, 的 规则 集合 P, 可 以 通过 两 步 得 到 。 

L 对 于 P 中 的 每 个 规则 A>w， 如 果 w 可 以 表示 为 : 

W AW, A; WAWy 41, 
其 中 4 Ace, A 是 w 中 可 空 变 量 集 的 子 集 。 那 么 在 P, 中 加 入 规则 
A—W VW; **"WLW, ,1: 

2. 去 掉 P, 中 除了 SA 以 外 的 入 -规则 。 

第 一 步 根据 原始 文法 中 的 每 条 规则 中 来 产生 P, 的 规则 。 如 果 一 条 规则 的 右 侧 出 现 了 nn 个 可 空 变 
量 ， 则 会 产生 2" 条 规则 。 第 二 步 删 除了 PL PRET S.A 的 -规则 。PL 中 的 规则 要 么 直接 来 自 P， 要 
么 从 P 中 推导 得 出 。 因 此 L(G.) CL(G)。 

另 一 方面 ， 要 证 明 L(G) 中 每 一 个 串 都 包含 在 L(G ) 中 。 这 是 因为 所 有 由 G 中 变量 推导 出 的 可 空 
串 也 可 以 从 G, 中 那个 变量 推导 出 。 设 4 Sw JG 中 的 一 个 推导 ,we 二” 。 可 以 用 归纳 法 证 明 4 2w. 
对 推导 长 度 半 做 归纳 ， 如 果 半 =1， 那 么 4-*w 是 P 中 的 规则 。 既 然 w 关 和 ， 那 么 Aw 在 P, 中 。 

假设 那些 在 G 中 可 以 由 某 个 变量 通过 步 或 小 于 nn 步 推 导出 来 的 串 也 可 以 由 Gi 的 某 个 变量 中 推 
导出 来 。 在 这 个 假设 中 没有 对 该 串 在 G 中 的 推导 长 度 加 以 限制 。 假 设 4 — w 是 一 个 串 的 推导 过 程 。 


如 果 我 们 使 用 第 一 条 规则 ， 则 推导 过 程 可 以 写成 : 
A=W, A WA; WAW W, 

这 里 A, eV 而且 we E'. 根据 引 理 3.1.5,，w 可 以 表示 为 : 

W 2Wip,W5p; “WiDr Wrri, 
其 中 A, 经 过 最 多 n 步 在 G 中 推导 出 p;。 对 于 每 个 p,e 二 ， 归 纳 假设 保证 了 存在 推导 A; DP, 如 果 
D=, IA A 是 G 的 可 空 变量 。 在 第 一 步 中 ,产生 了 规则 : 

A—W,AÀW;A; **W,A.W, 44 
在 这 条 规则 里 每 个 可 以 推导 出 空 串 的 变量 A, 都 被 去 掉 了 。 从 Gi 中 推导 出 w 可 以 分 两 步 ， 首 先 使 用 这 
条 规则 ， 然 后 使 用 归纳 假设 推导 每 一 个 pe Do | 

Gil 4.2.2 设 G 是 例 4.2.1 提供 的 文法 ，G 的 可 空 变 量 集 是 1S,4,C} 。 等 价 的 非 收 缩 性 文法 GL 如 

下 所 示 : 


G: S—ACA G,: S>ACA | CA| AA| AC| A| Cl A 
A—aAa| B| C A—aAa| aa| B| C 
B—bB|b B—bB | b 
C—cC| X C—cC | c. 


规则 S—A 可 以 使 用 两 种 方法 由 规则 SACA 得 来 的 : 去 掉 前 面 的 4 和 C， 或 者 去 掉 后 面 的 C 和 4。 所 
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有 的 入 -规则 ， 除 了 5 一 入 ， 都 被 去 掉 。 . O 

虽然 文法 G, 和 G 等 价 , 但 是 在 这 两 个 文法 中 ， 同 一 个 串 的 推导 过 程 可 能 不 一 样 。 最 简单 的 例子 
是 空 串 。 在 例 4.2. 2 rp, G 需要 用 6 条 规则 才能 从 开始 符 推 导出 空 串 ， 而 在 G, 中 可 以 直接 就 可 以 推 
导出 空 串 。 这 两 个 文法 都 可 以 通过 最 左 推导 得 到 串 aba, 


G; S—ACA G,: $2A 
—aAaCA =aAa 
—aBaCA —aBa 
—abaCA —aba 
—abaA 
—abaC 
—aba 


Gi 中 第 一 条 推导 得 到 了 变量 4，4 最 终 推导 出 了 所 有 终结 字符 串 。 因 此 避免 了 使 用 入 -规则 。 
例 4.2.3 W Ga b"c": 
G: S—>ABC 
A—4A | X 
B—bB | X 
C—cC| X 
G 的 可 空 变量 是 S、A、B 和 C。 去 掉 和 -规则 的 等 价 文法 是 
G,: S—ABC| AB| BC| AC| A| B| CIN 
A—aA | a 
B—bB|b 
C—cC | c. 
推导 时 采用 的 第 一 条 规则 决定 了 最 终 会 产生 哪 种 终结 符 。 既 然 S 是 可 空 的， 那么 就 加 入 规则 Sox, O 


4.3 去 掉 链 规则 


在 推导 中 ， 使 用 规则 AB 并 不 会 增加 导出 的 串 的 长 度 ， 也 不 会 产生 新 的 终结 符 ， 它 只 是 简单 地 
把 变量 重新 命名 了 。 这 种 规则 被 称 为 链 规则 (chain rules) 。 因 为 链 规则 仅仅 是 给 变量 重 命名 ， 所 以 可 
以 去 掉 。 考 虑 以 下 规则 : 
A—aA | a| B 
B5B | b| C. 
链 规则 A— B 表明 所 有 可 以 从 B 推 导出 的 串 也 可 以 从 A 推导 出 。 对 于 每 条 规则 Bow, ns np DAI 
和 人 一 条 规则 4 一 w， 那 么 就 可 以 删除 链 规则 。 链 规则 AB 可 以 被 三 条 A 规则 代替 ， 产 生 等 价 的 规则 。 
A—aA |a| bB| b| C 
B—BbB | b| C. l 
不 幸 的 是 ， 生 成 的 新 规则 中 包括 了 一 个 新 的 链 规则 。 可 以 重复 这 个 过 程 来 去 掉 新 的 链 规则 。 除 了 这 
样 ， 我 们 有 一 种 新 的 方法 可 以 一 次 去 掉 所 有 的 链 规则 。 
如 果 一 个 推导 4 之 C 只 包括 链 规则 ,那么 称 之 为 链 (chain) 。 算 法 4.3.1 给 出 了 一 个 非 收缩 性 文 
法 的 变量 A 通过 链 导 出 的 所 有 变量 的 生成 过 程 。 这 个 集合 表示 为 CHAIN(4) 。 集 合 NEW 包含 那些 在 
前 面 的 迭代 中 加 入 到 CHAIN(4) 中 的 变量 。 


算法 4.3.1 

集合 CHAIN(A) 的 构造 

输入 : 本 质 上 的 非 收缩 上 下 文 无 关 文法 G=(V,Z,P,S) 
1. CHAIN (A):-|A| 

2. PREV: =@ 
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3. repeat 
3. 1. NEW; = CHAIN(A) - PREV 
3.2. PREV: = CHAIN(A) 
3.3. for 任意 变量 Be NEW do 
for 任意 规则 B—C do 
CHAIN(A): = CHAIN(A) U{C} 
until CHAIN(A) = PREV 


算法 4. 3. 1 和 产生 可 空 变量 的 算法 完全 不 同 。 后 者 首先 找到 那些 直接 产生 空 串 的 变量 ， 然 后 再 将 
规则 倒 推 回去 。 如 果 规 则 右边 都 是 NULL 中 的 变量 ， 那 么 左边 的 变量 也 会 加 入 到 集合 中 。 
产生 CHAIN( A) 的 算法 遵循 自 顶 向 下 法 则 。 使 用 循环 递归 地 建立 所 有 4 通过 链 可 以 推导 出 的 变 
量 。 每 次 循环 是 在 以 前 发 现 的 链 基 础 上 再 添上 一 个 规则 。 算 法 4.3.1 中 产生 CHAINCA) 的 证 明 留 做 
练习 。 
引 理 4.3.2 已 知 G=(V, 有 ,PP,S) 是 一 个 本 质 上 非 收缩 上 下 文 无 关 文 法 。 算 法 4.3. 1 仅仅 使 用 链 
规则 就 由 A 推导 出 变量 集合 。 
CHAIN (A) 中 的 变量 决定 了 去 掉 A 链 规则 必须 进行 的 替换 。 通 过 去 掉 G 中 的 链 规则 得 到 的 文法 
ITE Geo 
定理 4.3.3 BH G- (V, X,P,S) LAM LARK 6 ET XUGX XR, MARA—-APAERMBEL 
FLAKLEG., 使 得 
i) L(G.) =L(G)。 
ii) Gc 是 本 质 上 非 收 缩 的 ， 并 且 没 有 链 规则 。 
证 明 : Gc 中 的 规则 是 使 用 集合 CHAIN(4) 和 G 中 的 规则 构造 而 成 。 如 果 变 量 B 和 字符 串 w 满足 
下 面 的 条 件 ， 则 规则 A—w 属于 Pc。 
i) Be CHAIN(A) 
ii) BoweP 
iii) weg V 
条 件 (ui) 保证 Pc 不 包含 链 规则 。Ge 中 的 变量 、 字 母 表 以 及 开始 符 都 和 G 中 的 相同 。 
根据 引 理 4. 1.2, Go 中 可 以 推导 出 的 每 个 字符 串 都 可 以 在 G 中 推导 出 。 因 此 , L(G.) SL(G)。 
现在 已 知 weL(G), FHA 3B 是 推导 w 的 过 程 中 使 用 的 最 长 的 链 规则 。w 的 推导 具有 下 面 的 形式 
S —uAv 好 By upv ID" 
Hop, Bp 是 规则 ， 但 不 是 链 规则 。 规 则 Ap 可 以 用 来 蔡 换 推导 中 的 链 规 则 序列 。 重 复 使 用 这 些 技 
AR, 去掉 所 有 的 链 规则 的 应 用 ， 从 而 最 终 产生 Gc 中 的 ws B 
Gil 4.3.1 文法 Gc 是 由 例 4.2.2 中 的 GL 构造 得 到 的 。 因 为 Gi 是 本 质 上 非 收 缩 的 ， 所 以 算法 
4.3. 1 使 用 链 规则 产生 了 可 以 推导 出 的 变量 。 计 算 构造 集合 
CHAIN(S) ={S,A,C,B} 
CHAIN(A) = {A,B,C} 
CHAIN(B) = | B} 
CHAIN(C) = |C}. 
这 些 集合 用 来 生成 Ge 的 规则 
Poe: $ACA | CA| AA | AC| aAa| aa| bB| b| cC| c| 
A—aAa | aa | bB| b| cC| c 
B—bB|b 
C—cC| c O 
去 掉 链 规则 会 增加 文法 中 规则 的 数目 ， 可 是 却 减 少 了 推导 的 长 度 。 构 造 本 质 上 非 收缩 文法 也 会 碰 
到 这 样 的 折衷 。 这 些 限定 需要 那 种 能 够 产生 语言 ， 但 不 会 简化 推导 的 附加 规则 。 i 
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从 本 质 上 非 收缩 文法 中 去 掉 链 规则 ， 它 的 非 收缩 性 性 质 仍 然 得 到 保持 。 设 Aw 是 一 个 由 去 掉 的 链 
规则 创建 的 规则 ， 这 就 意味 着 对 于 某 个 变量 Be CHAIN(A), ,存在 规则 Bw。 因 为 原来 的 文法 是 本 质 上 
非 收缩 的 ， 所 有 惟一 的 入 规则 就 是 5。 开始 符 是 非 递归 的 ， 对 于 任意 A 埃 5, 它 都 不 是 CHAIN(4) 中 
的 成 员 。 它 也 遵循 构造 Pc 过 程 中 不 会 增加 新 的 入 规则 的 原则 。 

没有 链 规则 的 本 质 上 非 收缩 文法 中 的 每 条 规则 都 具有 如 下 的 形式 : 

i) SA 

ii) A—a; 或 者 

iii) A—w 
其 中 we(YUZ)  ， 它 的 长 度 至 少 为 2。 规 则 S 仅仅 用 在 空 字符 串 的 推导 中 。 使 用 其 他 规则 就 会 
给 待 推导 的 字符 串 增 加 终结 符 ， 或 者 增加 字符 串 的 长 度 。 


4.4 无 用 符 


文法 用 来 生成 语言 ， 变 量 在 字符 串 的 产生 过 程 中 定义 句 型 的 结构 。 理 想 情 况 下 ， 文 法 中 的 每 个 变 
量 都 应 该 对 于 生成 语言 的 字符 串 有 贡献 。 然 而 ， 庞 大 的 文法 的 构造 ， oe ee 
些 生成 终结 字符 串 的 过 程 中 出 现 不 需要 的 变量 。 考 察 下 面 的 文法 : 
G: SSAC| BS| B 
A—aA | aF 
B—CF|b 
C—cC| D 
D—aD | BD| C 
E—4aA | BSA 
F—>bB | b. 
什么 是 L(G)? 这 些 变量 都 出 现在 终结 字符 串 的 产生 过 程 中 了 吗 ? 如 果 是 的 话 ， 为 什么 呢 ? 试图 说 服 
你 自己 L(G) = 六 。 为 了 识别 和 去 掉 无 用 符 ， 我 们 首先 给 出 下 面 的 定义 。 
定义 4.4.1 已 知 G 是 上 下 文 无 关 文 法 。 如 果 存 在 下 面 的 推导 ， 那 么 字符 xe (VU 对 ) 就 是 有 用 
的 (useful)。 
S =uxv >w, 
HP, u, ve( VUX) 3E we X^ "。 没 有 用 处 的 字符 叫做 无 用 的 〈useless) 。 
-如 果 终 结 符 出 现在 语言 G 的 字符 串 中 ， 那 么 这 个 终结 符 就 是 有 用 的 。 变 量 是 有 用 的 要 满足 下 面 两 
个 条 件 。 首 先 ， 变 量 必须 出 现在 文法 的 句 型 中 。 即 : 它 必须 出 现在 由 5 推导 出 的 字符 串 中 。 其 次 ， 句 
型 中 的 每 个 字符 都 必须 能 够 推导 出 终结 字符 串 〈 空 串 也 是 终结 字符 串 ) 。 下 面 的 两 步 程序 给 出 了 消除 
无 用 符 的 过 程 。 每 一 步 构造 满足 变量 是 有 用 的 一 个 条 件 。 
算法 4. 4. 2 构造 包含 可 以 推导 出 终结 字符 串 的 变量 的 集合 TERM。 算 法 中 使 用 的 策略 类 似 于 确定 
文法 中 的 可 空 变量 集合 的 策略 。 算 法 4. 4. 2 的 证 明 过 程 使 用 了 引 理 4.4. 2 中 的 证 明 策 略 来 生成 期 望 集 
个 证 明 过 程 留 作 练习 。 


算法 4.4.2 
构造 可 推导 出 终结 字符 串 的 变量 的 集合 
WA EFEK G= (VX PS) 
1. TERM: = |A| 对 于 we "存在 一 个 规则 A—>w eP} 
2. repeat 
2. 1. PREV: = TERM 
2.2. for {È A e V do 
if 存在 一 个 A 规则 A—w H we (PREVU Y.) * then 
TERM: = TERMU {A} 
until PREV = TERM 
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算法 结束 时 ，TERM 包含 了 G 中 产生 终结 字符 串 的 变量 。 不 属于 TERM 的 变量 是 无 用 的 。 它 们 对 
于 生成 L(G) 中 的 字符 串 是 没有 贡献 的 。 这 个 观察 结果 为 我 们 构造 等 价 于 G 的 文法 Gi 一 一 只 包含 一 个 
推导 出 终结 字符 串 的 变量 一 一 提供 了 动机 。 

引 理 4.4.3 已 知 G=(V, 玉 ,P,S) 是 上 下 文 无 关 文 法 。 存 在 一 种 算法 构造 上 下 文 无 关 文 G = 
(Vs Dm be dE 

i) L(G1) =L(G)。 

i) G, 中 的 每 个 变量 都 可 以 推导 出 Gt 中 的 每 个 终结 字符 囊 。 

WEBB: P+ 是 通过 去 掉 G 中 不 能 推出 终结 字符 串 的 变量 的 所 有 规则 获得 的 。 即 : 所 有 包含 变量 
V-TERM 的 规则 。G 的 构成 成 分 是 

V, = TERM 

P, = |A> w| A—>w 是 PP 中 的 规则 ,，A eTERM, JH we(TERMUX)"'|2fFHR. 

Yr=laeL| a 出 现在 Pr 规则 的 右 侧 |} 
字母 表 t 包 含 出 现在 Pr 规则 中 的 所 有 终结 符 。 

我 们 必须 证 明 L(G,) 2L(G), BHO P,CP, 所 以 G 中 的 每 个 推导 也 是 G 中 的 推导 ， 并 且 
L(G) SL(G)。 为 了 构造 相对 的 包含 关系 ,我 们 必须 证 明 去 掉包 含 V-TERM 中 的 变量 的 规则 ， 对 于 产 
生 终 结 字 符 串 的 集合 没有 影响 。 已 知 Sw 是 字符 串 we L(G) 的 一 种 推导 。 这 也 是 G, 中 的 一 种 推导 。 
如 果 不 是 的 话 ，V-TERM 中 的 变量 就 必须 出 现在 推导 的 中 间 步 又 中 。 由 包含 在 V-TERM 中 的 变量 构成 的 
句 型 的 推导 不 能 产生 终结 字符 串 。 因 此 ， 所 有 推导 中 使 用 的 规则 都 属于 P+， 因此 weL(G:)。 pi 

例 4.4.1 文法 Gr 是 由 本 节 开 始 的 文法 G 构造 的 。 

G: SSAC| BS| B 


A—aA | aF 
B—CF|b 
C—cC| D 
D—>aD | BD| C 
E—aA | BSA 
. F—bB|b 
算法 4.4.2 用 来 确定 G 中 推导 出 终结 字符 串 的 变量 。 
使 用 集合 TERM 来 构造 G+ ， 得 到 Pt TERM PREV 
V. 2 |$,A,B,E,F| 0 |B,F| 
+= {a,b} 1 |B,F,A,S| |B,F| 
P,:$—BS| B 2 1B,F,A,S,E| | B,F,A,S| 
Á-54A | dF 3 {B,F,A,S,E} |B,F,A,S,E| 
B—b 
E—4aA | BSA 
F—BB | b. 
这 个 使 用 变量 C at D 得 到 的 间接 递归 推导 ， 是 使 用 算法 发 现 的 。 所 有 包含 这 些 变量 的 规则 都 要 删 掉 。 


口 

Gr 的 构造 完成 了 去 掉 无 用 变量 过 程 的 第 一 步 。G+ 中 的 所 有 变量 都 可 以 推导 出 终结 字符 串 。 我 们 

现在 必须 去 掉 那 些 不 会 出 现在 文法 的 句 型 中 的 变量 。 集 合 REACH 就 是 那些 由 5 可 以 推导 出 的 所 有 变 
量 构成 的 。 


算法 4.4.4 
可 达 变 量 集合 的 构造 
WA: 上 下 文 无 关 文法 G=(V, 3P;5) 
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1. REACH: = 
2. PREV: =@ 
3. repeat 

3. 1. NEW: = REACH - PREV 

3.2. PREV: = REACH 

3. 3. for 任意 Ae NEW do 

for 任意 规则 4 — w do 把 w 中 的 所 有 变量 添加 到 REACH 中 
until REACH = PREV 


ts] 





算法 4. 4. A 和 算法 4. 4. 3 类 似 , 使 用 了 自 顶 向 下 的 方法 来 构造 变量 的 期 望 集合 。 集 合 REACH 使 
用 3 初始 化 。 每 当 在 S 推导 过 程 中 发 现 了 新 的 变量 ,就 把 它 放 到 REACH 中 。 

引 理 4.4.5 Be G- (V, E,P,S) ER ET XL XSGE, Jk 4.4.4 产生 了 所 有 由 5 可 以 推导 出 的 
变量 的 集合 。 

证 明 : 第 一 ,我 们 必须 证 明 REACH 中 的 每 个 变量 都 可 以 由 5 推导 出 。 证 明 是 依靠 对 算法 迭代 的 
次 数 进行 归纳 的 。 

集合 REACH 初始 是 5， 它 显然 是 可 达 的 。 假 设 集合 REACH 中 的 所 有 变量 经 过 nn 步 迭 代 都 可 以 由 
5 到 达 。 已 知 B 是 在 第 n+1 步 迭 代 添加 到 集合 REACH 中 的 。 那 么 存在 规则 A—uBv, Hip, A 经 过 n 
次 迭代 就 属于 REACH, 根据 归纳 ， 存 在 推导 S SxAy, (EH AuBV 扩展 这 个 推导 ， 我 们 就 构造 了 B 
的 可 达 性 。 

我 们 现在 必须 证 明 由 5 可 达 的 每 个 变量 最 终 都 会 添加 到 集合 REACH 中 。 如 果 5 SuAv, 那么 4 就 
在 第 nn 步 循环 或 之 前 添加 到 集合 REACH 中 。 这 个 证 明 是 通过 对 由 5 开始 的 推导 的 长 度 进行 归纳 完 
成 的 。 

开始 符 是 推导 长 度 为 0 的 惟一 一 个 可 达 变 量 。 它 在 算法 的 第 一 步 就 被 放 到 REACH 中 了 。 假设 推 
导 长 度 不 超过 的 变量 在 经 过 n UGE BUR T REACH 中 。 

EA S SxAyoxuBvyS 是 G 中 的 推导 ,并 且 第 n+1 步 应 用 的 规则 是 A 一 uBv。 根 据 归纳 假设 ，A4 
在 迭代 nn 次 后 放 到 REACH 中 。 在 后 面 的 迭代 中 ，B 放 到 REACH 中 。 m 

定理 4.4.6 已 知 G=(V, 工 ,P,8) 是 上 下 文 无 关 文 法 。 存 在 一 个 算法 来 构造 上 下 文 无 关 文法 Gu， 
使 得 

i) L(G,) =L(G)。 

ii) Gy 没有 无 用 符 。 

WEBB: 去 掉 无 用 符 开 始 于 由 G 构造 G+。 算 法 4.4.4 用 来 生成 从 开始 符 可 达 的 G, 中 的 变量 。G 
中 所 有 引用 从 5 不 可 达 的 变量 的 规则 都 要 去 掉 从 而 获得 Gu, XH Vy =REACH，Pu = {A> w] "M 
weP,, Ae REACH, JH we(REACHUX)'|fiB X,-2lae X|a HRE Py 规则 右 侧 } 。 

为 了 构造 L(Gu) 和 L(Gi) 的 等 价 性 ,需要 证 明 G 可 以 推导 出 的 每 个 字符 串 都 可 以 在 Gu 中 推导 
Ho BA wÆ L(G) PR. ERES w 的 过 程 中 出 现 的 每 个 变量 都 是 可 以 推导 出 的 ， 并 且 这 个 过 





程 中 使 用 的 规则 都 属于 Pu 。- E 
例 4.4.2 文法 Gu 是 由 例 4. 4. 1 中 的 G, 构造 得 到 循环 REACH PREV NEW 
AY, Gy 中 的 可 达 变 量 集 合 可 以 使 用 算法 4.4. 4 得 到 。 0 Is] Ø 
去 掉 所 有 对 变量 A、E 和 的 引用 而 产生 的 文法 是 ] 15,8] [S] I8] 
Gy: S+BS| B OK eet S Pte 
Bb. 
文法 Gu 等 价 于 本 节 初 给 出 的 文法 G。 很 明显 ， 这 些 文法 产生 的 语言 就 是 六 。 口 


去 掉 无 用 符 的 过 程 包括 定理 4.4.6 中 列 出 的 两 个 步骤 。 第 一 步 是 去 掉 不 能 够 产生 终结 字符 串 的 变 
量 。 然 后 清除 那些 不 能 够 从 开始 符 推导 出 的 变量 ， 就 得 到 了 需要 的 文法 。 如 果 按 照相 反 的 顺序 应 用 这 
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两 个 步骤， 那么 可 能 不 会 去 掉 所 有 的 无 用 符 ， 下 一 个 例子 就 描述 了 这 种 情况 。 
例 4.4.3 已 知 G 是 文法 
G: S—a| AB 
Ab. 
通过 使 用 两 种 不 同 的 顺序 应 用 这 两 个 步 又， 我 们 知道 了 转换 过 程 中 按 顺 序 应 用 步骤 的 必要 性 。 


去 掉 不 能 产生 终结 字符 串 的 变量 : 去 掉 不 可 达 字 符 : 
$a S—a| AB 
A—b Ab 
去 掉 不 可 达 字 符 : 去 掉 不 能 产生 终结 字符 串 的 变量 : 
S—a $—a 
Ab 
变量 4 和 终结 符 是 无 用 的 ， 但 是 按照 相反 的 顺序 进行 转换 ， 它 们 就 会 仍然 留 在 文法 当中 。 口 


文法 向 范式 的 转换 包含 了 一 系列 的 算法 步骤 ， 每 一 步 的 转换 仍然 保持 转换 前 的 性 质 。 去 掉 无 用 符 
的 过 程 不 能 够 取消 构造 G 或 Gc 获得 的 限制 。 这 些 转换 只 去 掉 了 规则 ， 而 并 没有 改变 文法 的 任何 特 
点 。 然 而 ， 在 把 一 种 文法 转化 成 男 一 种 文法 的 过 程 中 ， 可 能 会 引入 无 用 符 。 这 种 现象 将 会 在 练习 8 和 
练习 17 的 转化 中 得 到 解释 。 


4.5 乔 姆 斯 基 范 式 


. ”范式 是 使 用 文法 必须 满足 的 条 件 集合 来 描述 的 。 乔 姆 斯 基 范 式 对 规则 右 侧 的 长 度 和 分 解 进行 了 

限制 。 

定义 4.5.1 如 果 文 法 的 每 条 规则 都 符合 下 面 的 形式 之 一 ， 那 么 上 下 文 无 关 文 法 G=(V,,P,5) 
就 是 乔 姆 斯 基 范 式 (chomsky normal form) 。 

i) A—BC, 

ii) Aa, 或 者 

ii) Snr, 
XT, B, CeV- {S|。 

因为 规则 右 侧 的 字符 数目 最 多 是 2， 所 以 乔 姆 斯 基 范 式 的 文法 的 推导 对 应 的 推导 树 是 二 又 树 。 规 
则 ABC 的 应 用 就 会 生成 一 个 子 节点 是 B 和 C 的 节点 。 所 有 其 他 规则 的 应 用 都 会 产生 一 个 子 节点 。 
第 7 章 将 使 用 二 叉 推导 树 表 示 的 推导 ,来 构造 上 下 文 无 关 语 言 的 重复 性 质 。 在 下 一 节 中 ， 我 们 将 使 用 
这 种 把 文法 G 转化 成 乔 姆 斯 基 范 式 的 能 力 来 获得 L(G) 中 字符 串 的 确定 成 员 关系 的 程序 。 

在 前 一 节 给 出 的 一 系列 修改 之 后 ， 我 们 接着 介绍 把 文法 转化 成 乔 姆 斯 基 范 式 。 我 们 假设 要 转化 的 
文法 G 有 一 个 非 递归 的 开始 符 ， 除 了 5 一 A 外 没有 入 规则， 没有 链 规则 ， 并 且 没有 无 用 符 。 

定理 4.5.2 已 知 G=(V, 工 ,P,$) 是 上 下 文 无 关 文 法 。 存 在 一 种 算法 来 构造 等 价 于 G 的 乔 姆 斯 基 
AU X G'Z(V'E,P'S). 

TERA: 按照 前 面 的 转化 之 后 ， 规 则 就 具有 了 Sor, Aca 或 4 一 mw 的 形式 ， 其 中 we((VUZ) - 
{S})*, FFA length(w) >1。G' 的 规则 集合 P' 是 由 G 的 规则 构造 而 成 的 。 

G 中 右 侧 长 度 为 0 的 规则 就 是 Sr, AA G 不 包含 链 规则 ， 所 以 当 w 的 长 度 是 1 时， 规则 A 一 w 
的 右 侧 是 一 个 终结 符 。 在 任何 一 种 情况 下 ,规则 都 满足 乔 姆 斯 基 范 式 的 条 件 ， 并 且 可 以 放 到 P' 中 。 

已 知 Aw 是 length(w) 大 于 1 的 规则 。 字 符 串 w 可 能 既 包 含 变 量 ， 也 包含 终结 符 。 第 一 步 是 去 掉 
所 有 规则 右 侧 的 终结 符 。 这 一 点 是 通过 增加 新 的 变量 和 规则 来 完成 的 ， 即 把 每 个 终结 符 重新 命名 为 一 
个 变量 。 例 如 ， 规 则 
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A-bDcF 
可 以 由 下 面 三 条 规则 替换 
A—GB'DC'F 
B'—b 
C'—c. 
右 侧 的 长 度 等 于 或 超过 2 的 规则 依然 按照 这 种 方式 进行 转换 。 这 样 ， 规 则 的 右 侧 就 只 包含 空 字符 串 、 
终结 符 和 变量 串 。 最 后 这 种 情况 的 规则 必须 拆 成 一 系列 的 规则 ， 每 个 规则 的 右 侧 只 包含 两 个 变量 。 应 
用 这 一 系列 的 规则 ， 就 自然 可 以 生成 原来 规则 的 右面 。 继 续 前 面 的 例子 ,我 们 使 用 下 面 的 规则 替换 A 
规则 
A—B'T, 
T, —DT, 
T,—C'F. 
变量 T, A T, 被 引入 用 来 连接 这 一 系列 的 规则 。 重 写 那 些 右 侧 长 度 大 于 2 的 规则 ， 从 而 完成 到 乔 姆 斯 
基 范 式 的 转换 。 m 
例 4.5.1 已 知 G 是 文法 
S—aABC | a 
A—aA | a 
B—bcB | bc 
C—cC | c. 
这 个 文法 已 经 满足 了 开始 符 、 和 规则 和 不 包含 链 规则 和 空 符 的 条 件 。 通 过 转换 那些 右 侧 长 度 超过 2 的 
规则 把 它 转 化 成 等 价 的 乔 姆 斯 基 范 式 文法 。 
G’; S—A'T,| a 
A'—a 
T,—AT, 
T,—BC 
A—>A'A |a 
B—>B'T, | B'C' 
T,—C'B 
CC'C|c 
B'—b 
C'—c o 
14.5.2. 规则 
X—aXb | ab 
产生 了 字符 串 |a'b'| i=1}。 增 加 一 个 开始 符 , 以 及 规则 Sx， 并 且 去 掉 链 规则 ， 就 产生 了 新 的 文法 
$—aXb | ab 
X—.4aXb | ab. 
乔 姆 斯 基 范 式 
S—AT| AB 
T—XB 
X-5AT | AB 
A—a 
B—b 
是 通过 增加 规则 Aa 和 Bob 33K S8]. KAMA AEE Y $9, FRAC aT SRI X ALI Al 
的 长 度 。 口 
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4.6 CYK 算法 


已 知 上 下 文 无 关 文 法 G 和 字符 串 u, & 属于 L(G) 吗 ? 这 个 问题 叫做 上 下 文 无 关 文 法 的 成 员 问 题 。 
使 用 乔 姆 斯 基 范 式 文法 中 规则 的 结构 ，J. Cocke, D. Younger 和 T. Kasami 独立 地 提出 了 解决 这 一 问题 
的 算法 。CYK 算法 使 用 自 底 向 上 的 方法 来 确定 字符 串 的 可 推导 性 。 
已 知 & xxx, 是 用 来 测试 成 员 关 系 的 字符 串 ， 并 且 x, ;表示 u ITUR x,…x)。 值 得 注意 的 是 ， 
子 串 ,简化 x 一 一 x 中 第 i 个 字符 。CYK 算法 的 策略 是 : : 
e 第 一 步 : HF u 中 长 度 为 1 的 每 个 子 串 x;;， 找 到 规则 Ax, ;中 的 4 这 种 变量 构成 的 集合 Xio 
e 第 二 步 : 对 于 4 中 长 度 为 2 的 每 个 子 串 x,,,, ， 找 到 产生 初始 推导 A 壹 x ;, 中 的 变量 构成 的 集 
合 Xin o 

e 第 三 步 : 对 于 中 长 度 为 3 的 每 个 子 串 x,,,， 找 到 产生 初始 推导 4 xiu PER A 
合 X; i222 

e 第 n-1 步 : 对 于 wu 中 长 度 为 n-1 WF x, 加 ,,， 找 到 产生 初始 推导 A Sx, MA Sx, 
中 变量 构成 的 集合 和 ;和 Xp no 

。 第 n 步 : 对 于 “中 所 有 长 度 为 上 的 字符 串 鸭 ,。=x， 找 到 产生 初始 推导 4 Dex, 中 所 有 变量 构成 
HRE Xino 

如 果 开 始 符 $ 属于 X,,， 那 么 4 就 属于 这 种 文法 产生 的 语言 。 集 合 X, ;的 生成 过 程 使 用 了 一 个 叫 
做 动态 编程 的 技术 。 动 态 编程 的 重要 特点 就 是 在 第 t 步 计算 集合 X, 需要 的 信息 都 已 经 在 第 1 到 +-1 
步 获得 了 。 

我 们 看 看 为 什么 这 种 性 质 对 于 使 用 乔 姆 斯 基 范 式 的 推导 是 正确 的 。 在 第 一 步 构造 集合 的 过 程 是 很 
直观 的 。 如 果 Ax, 是 文法 的 规则 ， 那 么 A e X,,。 

对 于 第 二 步 ， 子 串 2 的 推导 具有 如 下 形式 

A —BC 
-—xC 





=X; Xi41- 
因为 B 推 导出 x,， 而 C 推 导出 x,,， 所 以 这 些 变量 都 应 该 属于 X ,和 X,,1;,1。 当 存在 规则 ABC, 3f 
且 BeX,,; 时 ， 就 把 变量 A 放 到 X, rhe 
现在 我 们 考虑 算法 第 t 步 中 的 集合 X;,;,, 的 产生 。 我 们 希望 找到 推导 出 子 串 x;,, 的 所 有 变量 。 应 用 
第 一 条 规则 到 这 样 的 推导 中 ， 就 产生 了 两 个 变量 ,分 别称 之 为 B 和 C。 紧 接着 是 用 B 和 C 开始 的 推 
F, 产生 x;,,。 因 此 ， 推 导 过 程 如 下 i 
4 一 BC 
-xa4C 
Sx i ipe 
其 中 对 于 任意 的 介 于 i 和 +t-1 之 间 的 k, HU BPE xa CPA Xo Alt, ATESUB x uu M4 
在 规则 A 一 BC， 并 且 数 字 k 介 于 i 和 1-1 之 间 ， 且 BeX;, 和 CeX,,1i,,。 在 检查 这 个 条 件 中 ， 所 有 需 
要 考察 的 集合 都 是 在 第 t 步 之 前 产生 。 
集合 X ;可 以 表示 成 一 个 nxn 和 矩阵 的 上 三 角 部 分 。 


1 2 3 Zn n-1 n 
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CYK 算法 使 用 对 角 化 从 X, ,的 右上 角 开 始 构造 了 对 角 的 入口 。 
我 们 使 用 例 4.5.2 中 生成 (ab | i=1| 和 字符 串 aaabbb 的 文法 来 解释 CYK 算法 。 表 4-1 跟踪 了 
算法 的 步骤 ， 并 给 出 了 计算 的 结果 。 





1 2 3 4 5 6 
1 {A} o o Ø Ø 1S, X} 
2 {A} Ø Ø {S, X} {T} 
3 (AL. 1S, X]. . {7} Ø 
4 {B} Ø Ø 
5 |B} e 
6 {B} 


对 角 化 的 集合 是 使 用 规则 A— a 和 Bb 获得 的 。 第 二 步 产 生 了 对 角 上 的 入 口 。 集 合 X,,,, 的 构造 
仅仅 需要 考虑 子 串 x F Xo WA, WREE X = {A} AIX, = 14} 中 的 变量 一 一 它们 是 规则 的 
右 侧 ， 那 么 变量 就 属于 X,,,。 因 为 AA 不 是 规则 的 右 侧 ， 所 以 X, ,= 0. MAX, ,是 由 X,, = 14} 和 
X,,- [B HET. FAE AB 是 SAB Ail XOAB 的 右 侧 。 因 此 ，5 和 和 都 属于 X40 

在 第 ! 步 ， 存 在 待 检 查 的 子 串 x,,, 的 1-1 个 不 同 的 分 解 。 表 4-1 中 的 最 右 列 中 的 集合 X, 是 通过 
检查 所 有 上 -1 种 可 能 性 获得 的 变量 的 并 。 例 如 ， 计 算 X, ;需要 考察 两 种 分 解 x ,x ,和 Xs Hj As cs ee 
因为 Se X,。，B e Xs,s;， 所 以 变量 T 被 放 到 这 个 集合 中 ， 并且 TSB 是 正确 的 。 集 合 X up 8 的 存在 
意味 着 字符 串 aaabbb 属于 这 种 文法 产生 的 语言 。 

利用 前 面 列 出 的 步骤 ， 算 法 4.6.1 给 出 了 CYK 对 于 成 员 问题 的 解决 方案 。 围 绕 着 对 角 化 的 集合 
计算 参见 第 二 行 。 变 量 step 指 的 是 待 分 析 的 子 串 的 长 度 。 在 第 3. 1 步 开始 的 循环 中 ,1 指 的 是 子 串 的 
开始 位 置 ， 而 上 指 的 是 第 一 个 和 第 二 个 构成 成 分 被 拆 分 的 位 置 。 


算法 4.6.1 
CYK 算法 
MA: OEPOCEXOOGEG- (V, E, P, S) 
FER usine" 
1. 把 所 有 的 X, ,初始 化 为 Ø 
2. for i=1 ton 
对 每 个 变量 4， 如 果 存 在 规则 A—2x,, ABA X,,: 2X,UIAI 


3. for step =2 to n 





3.1. for i=1 ton-step+1 
3.1.1. for k=i to i+ step -2 
如 果 存 在 变量 Be Xi, ,Ce Ae i ues) ， 以 及 
规则 ABC, ALA A Edi : = Ri U{A} 
4. WR SeX,,,,ueL(G) 





上 面 列 出 的 CYK 算法 ， 是 用 来 确定 一 个 字符 串 推导 集合 

u 是 否 可 以 由 一 种 乔 姆 斯 基 范 式 文法 推导 得 出 。 可 以 SAT AeX,,, TEX) 6 

对 算法 进行 修改 ， 从 而 用 来 生成 L(G) 中 字符 串 的 推 — aT fex. 

导 ， 即 : 分 析 器 。 这 可 以 通过 记录 往 集合 X ,中 添加 ==32X8B XeXrs, BeXes 

的 变量 的 调整 来 完成 。 为 了 演示 这 种 方法 , 我 们 将 使 ATB AeX,2, TEXs 5, BeXse 
用 表 4-1 中 的 计算 的 轨迹 来 生成 字符 串 aaabbb 的 推 — 94478. TeXss, BeXs 

导 。 标 有 “集合 ”的 列表 示 包 含 匹 配 规则 右 侧 的 变 。 一 MaXBB XeXaa, BeXss, BeXes 

—aaABBB AeX;33, BeX,,, BeX,;,, BeX;, 


量 的 集合 。 例 如 ,变量 S 被 放 到 Xs +h, HW A 
X, AT e X, 的 存在 匹配 了 规则 SAT 的 右 侧 。 把 


=>aaabbb 
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这 个 构造 过 程 逆 过 来 ， 就 可 以 使 用 规则 SA 来 推导 aaabbb , 
CYK 算法 作为 分 析 器 的 应 用 受 限 于 需要 找到 推导 的 计算 需求 。 对 于 长 度 为 n 的 输入 字符 串 ， 需 要 
构造 (mw +n)/2 个 集合 来 完成 动态 编程 表格 。 而 且 ， 每 个 这 样 的 集合 都 需要 考虑 相关 子 串 的 多 种 分 解 。 




































































在 本 书 的 第 五 部 分 ， 我 们 考察 那些 专门 针对 有 效 分 析 而 设计 的 文法 和 算法 。 127 
表 4-1 CYK 算法 的 轨迹 
步骤 字符 串 Xij 子 串 Xi. Kily Xi; 
2 Xj, 7 aa Xs X22 {A} {A} Ø 
X23 =aa X123 X33 (Al (Al Ø 
X3 4 =ab X335 X44 {A} {B} {S, X] 
X45 =bb Xia X55 {B} {8} Ø 
xs,6 =bb Xs» X6,6 {B} {B} Ø 
3 Xj, 7 aaa Xs X23 {A} 9 Ø 
X123 X33 Ø {A} @ 
Xz, 4 =aab X22» Xia {A} {S, x] Ø 
X35 X44 Ø {B} [2] 
X3,5 - abb X333 Xa,s {A} [7] Ø 
X34» Xs,s (S, X) {B} [T] 
4,6 = bbb 4,4 %5,6 {B} Ø Ø 
X4, 5s X6,6 Ø {B} Ø 
4 Xı 4 = aaab Xis X24 (A] Ø Ø 
X29 %3,4 Ø {S, x] Ø 
X1,3 %4,4 [7] {B} Ø 
X2,5 = aabb X223 %3,5 {A} {T} {S, x) 
%2435 X4,5 Ø Ø Ø 
Xo,4» Xs, Ø {B} Ø 
X35 = abbb X335 *4,6 {A} Ø Ø 
Xia» Xs,6 {S, X] Ø Ø 
Xiss X6,6 (T) {B} D 
5 1,5 = aaabb Xi %2,5 {A} {S, x] Ø 
和 ,2 %3,5 Ø {T} Ø 
Xy3s %4,5 Ø Ø Ø 
Xyas %5,5 Ø {B} Ø 
Xz, = aabbb X225 %3,6 {A} Ø Ø 
i %2435 X4,6 Ø Ø [7] 
X243 Xs, Ø Ø Ø 
Xjss X6,6 (S, x] {B} {T} 
6 X16 = aaabb Xia X2,6 {A} {7} {S, X) 
X1,25 %3,6 Ø Ø [7] 
X35 Xai6 o o o 
Xiao Xs,6 Ø Ø Ø 
Xs» X6, o {B} Ø 128 





4.7 去掉 直接 左 递 归 


在 任意 的 上 下 文 无 关 文法 的 推导 中 ， 可 以 在 推导 的 任意 位 置 使 用 规则 ， 从 而 按照 任意 顺序 产生 
终结 符 。 例 如 ， 文 法 G, 中 的 推导 在 变量 的 右 侧 产 生 了 终结 符 ， 而 G, 中 的 推导 在 两 侧 都 产生 了 终 
G,: $—4Aa G,: S—aAb 

A—4Aa| b A—aAb | X 
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乔 姆 斯 基 范 式 在 推导 当中 为 终结 符 的 产生 添加 了 结构 。 字 符 串 是 按照 从 左 到 右 的 顺序 应 用 每 一 条 规则 
添加 一 个 终结 符 构造 的 。 在 推导 5S SuAv rh, A 是 最 左 变量 ,字符 串 u 称 作 是 句 型 的 终结 符 前 组 (ter- 
minal prefix) 。 我 们 的 目的 就 是 为 了 构造 一 种 应 用 每 条 规则 都 可 以 增加 终结 符 前 级 的 文法 。 
文法 G, 提供 与 我 们 期 望 完全 相对 的 规则 的 例子 。 变 量 4 一 直 都 是 最 左 符号 ， 直 到 推导 使 用 规则 
A 一 b 结束 。 考 虑 字符 串 baaa 的 推导 
S 一 4a 
—4Aaa 
=Aaaa 
—baaa. 
应 用 左 递归 规则 A—Aa 产生 了 a 的 字符 串 , 但 是 并 没有 增加 终结 符 前 级 的 长 度 。 这 种 形式 的 推导 叫做 
直接 左 递 归 (directly left-recursive)。 只 有 在 没有 使 用 左 递归 规则 时 ， 前 缀 才 增 加 。 
向 乔 姆 斯 基 范 式 转化 过 程 中 的 重要 一 步 就 是 从 文法 中 去 掉 左 递归 规则 。 下 面 几 个 例子 解释 了 消除 
左 递归 规则 的 技术 
a) A—Aa| b b) A—4Aa| Ab| b| c c) AAB| BA| a 
B—b|c 
使 用 这 些 集合 生成 的 是 ae” , (bUc) (aUp) fll (bUc)*a (pUc) 。 左 递归 在 递归 变量 的 右 侧 构 
造 字 符 串 。 递 归 序 列 是 通过 应 用 不 是 左 递归 的 A 规则 来 终止 的 。 为 了 从 左 到 右 地 构造 字符 串 ， 首 先 应 
用 非 递归 规则 ， 然 后 使 用 右 递归 来 构造 剩 下 的 字符 串 。 下 面 的 规则 产生 了 和 前 面 的 例子 相同 的 字符 
串 ， 而 且 它们 没有 使 用 直接 左 递归 。 


a) AbZ| b b) A—bZ| cZ| b| c c) A—BAZ| aZ| BA | a 
ZaZ|a Z—aZ| bZ| al b Z—BZ| B 
B—b|c 


(a) 中 的 规则 使 用 右 递 归 代 替 左 递归 ， 从 而 产生 了 ba' 。 使 用 这 些 规则 ， 在 推导 baaa 的 过 程 中 ， 应 
用 它们 中 的 每 一 条 规则 来 增加 终结 符 前 绥 的 长 度 。 
A —bZ 
=>baZ 
—baaZ 
—baaa 
去 掉 直 接 左 递归 ， 需 要 在 文法 中 添加 一 个 新 的 变量 。 这 个 变量 引入 了 一 个 右 递归 规则 的 集合 。 直 接 右 
递归 导致 递归 变量 出 现在 推导 字符 串 的 最 右 端 。 
为 了 消除 直接 左 递归 ，4 规则 被 拆 成 两 部 分 : 左 递归 规则 
A—Au, | Au, | | Au; 
和 规则 
Av, | V2 | -| Vis 
其 中 ， 每 个 的 第 一 个 字符 都 不 是 4。 使 用 这 些 规 则 的 最 左 推导 过 程 包括 一 系列 左 递归 规则 ， 然 后 直 
接应 用 规则 A— v, 来 结束 直接 左 递 归 。 使 用 前 面 例子 解释 的 技术 ， 我 们 构造 新 的 规则 来 先 产生 v, SA 
后 使 用 右 递 归 生 成 字符 串 的 剩 下 部 分 。 
4 规则 
Av, |---| v, | v,Z| | vZ 
首先 产生 推导 出 字符 串 的 左 侧 的 一 个 w。 如 果 字 符 串 包含 一 系列 的 七， 那么 它们 就 可 以 使 用 右 递归 由 
Z 规则 推导 得 出 
Z—u,Z| -| u,Z| u, | -| uj 
例 4.7.1 使 用 下 面 这 个 规则 集合 ， 但 是 不 要 使 用 直接 左 递归 ， 来 生成 同样 的 字符 串 。 
4 一 4a| Aab | bb| b 
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这 些 规则 产生 的 是 (bUbb) (aUab)" 。 在 推导 中 的 直接 左 递归 通过 应 用 原来 的 规则 A b s; Abb 
来 终止 推导 过 程 。 为 了 按照 从 左 到 右 的 方式 来 构造 这 些 字符 串 ,， 我 们 使 用 A 规则 
Abb | b | bbZ| bZ 
来 产生 字符 串 的 最 左 字 符 。Z 规则 使 用 下 面 的 右 递归 规则 来 生成 (aU ab) * : 
Z—aZ| abZ | a | ab. E 
518 4.7.1 已 知 G=(V, 二 ,P,S$) 是 上 下 文 无 关 文法 ， 并 且 4AEV 是 G 中 的 直接 左 递归 变量 。 那 
么 就 存在 一 种 算法 来 构造 等 价 的 文法 G' =(V',D,P',S'), 使 得 A 不 是 直接 左 递归 的 。 
证 明 : 我 们 假设 G 的 开始 符 是 非 递归 的 ， 惟 一 的 入 规则 是 Sor, FFA PALA HMM A 一 4。 如 果 
不 是 这 样 的 话 ，G 就 可 以 转化 成 一 个 满足 这 些 条 件 的 等 价 文法 。G' 的 变量 是 G 中 的 变量 增加 一 个 附加 
的 变量 来 生成 右 递归 规则 。P' 是 由 了 使 用 上 面 列 出 的 技术 来 构造 的 。 
新 的 A 规则 不 是 左 递归 的 ， 因 为 每 个 v 的 第 一 个 字符 不 是 4。Z 规则 也 不 是 左 递归 的 。 变 量 Z 不 
UE u 中， 并且 根据 G 中 的 A 规则 wu 是 非 空 的 。 gi 
这 个 技术 可 以 反复 使 用 ， 从 而 去 掉 所 有 使 用 左 递归 规则 的 地 方 ， 并 且 获 得 的 还 是 文法 的 语言 。 然 
而 ， 使 用 规则 A—Bu 和 B—Av 的 推导 ， 可 以 生成 句 型 
A Bu 
=>Avu 
—Buvu 
—Avuvu 


这 就 展示 了 使 用 直接 左 递归 推导 出 的 终结 符 前 组 的 长 度 的 共同 缺陷 。 格 立 巴 赫 范 式 的 转换 将 去 掉 所 有 
可 能 的 非 直接 左 递归 。 


4.8 格 立 巴 赫 范 式 


在 格 立 巴赫 范式 中 ， 每 个 规则 的 应 用 ， 就 会 给 期 望 字符 串 的 终结 符 前 级 增加 一 个 字符 。 这 就 保证 
TEŽ, 不管 是 直接 还 是 间接 的 ， 都 不 会 出 现 。 它 也 能 保证 长 度 n >0 的 字符 串 的 推导 仅 包含 n 步 
规则 应 用 。 

定义 4.8.1 如 果 每 条 规则 都 具有 下 述 形 式 中 的 一 种 ， 那 么 这 个 上 下 文 无 关 文 法 G=(V,》,P,5S) 
就 属于 格 立 巴赫 范式 (Greibach normal form) 的 。 

i) A—aA,A,:-A,, 

i) Aa, RF 

iii) S>), 

其 中 ,,aE 了 和 对 于 1=1，2，…, ngA A;eV- 4S], 

乔 姆 斯 基 范 式 转 化 成 格 立 巴赫 范式 要 使 用 两 个 规则 转化 技术 : 引 理 4.1.3 中 的 规则 替换 方法 以 及 
去 掉 左 递归 的 转化 。 这 个 过 程 首先 是 给 文法 中 的 变量 编号 。 开 始 符 编号 1， 剩 下 的 变量 依照 任意 顺序 
编号 。 不 同 的 编号 顺序 可 能 会 导致 不 同 的 文法 转换 ， 但 是 按照 什么 顺序 转化 都 可 以 。 

转化 的 第 一 步 是 构造 文法 ， 从 而 使 其 中 的 任何 一 条 规则 都 具有 下 面 的 形式 之 一 : 

i) S>) 

ii) A—aw, 或 者 

iii) A—Bw, 

其 中 weV* ,并 且 在 给 变量 编号 的 过 程 中 赋予 B 的 序号 的 数字 都 要 比 A 的 大 。 根据 变量 标号 的 顺序 ， 
这 些 规则 被 转化 成 满足 条 件 ( 诈 )。 乔 姆 斯 基 范 式 文法 转化 成 格 立 巴 赫 范式 是 通过 跟踪 文法 G 的 规则 
转化 来 解释 的 : 
G: SAB|X 
A—AB| CB| a 
B>AB | b 
C>AC| c. 


[130] 
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XES, A, B C 分 别 编号 为 1， 2, 3 和 4。 
因为 乔 姆 斯 基 范 式 文法 的 开始 符 不 是 递归 的 ， 所 以 S 规则 已 经 满足 了 这 三 个 条 件 。 继 续 把 4 规则 
转化 成 一 组 规则 的 集合 ， 这 些 集合 右 侧 的 第 一 个 字符 或 者 是 终结 符 ， 或 者 是 一 个 序号 大 于 2 的 变量 。 
左 递归 规则 A—AB 影响 了 这 些 限制 。 引 理 4. 7. 1 用 来 去 掉 直接 左 递 归 ， 从 而 得 到 
S—-AB| N 
A—CBR, | aR, | CB| a 
B—AB|b 
CoAC| c 
R,—BR, | B. 
现在 8 规则 必须 转化 成 正确 的 形式 。 规 则 BAB 必须 被 替换 ， 因 为 B 的 序号 是 3， 而 右 侧 的 第 一 
个 字符 4 的 序号 为 2。 引 理 4.1.3 允许 规则 BAB 右 侧 的 首位 4 BEA 规则 的 右 部 蔡 换 ， 从 而 产生 
S—AB| X 
A—CBR, | aR, | CB| a 
B—CBR,B | aR,B | CBB | aB | b 
C—4AC| c 
R,BR, | B. 
把 引 理 4. 1. 3 的 替换 技术 应 用 到 C 规则 ， 从 而 产生 两 个 左 递归 规则 
S—AB| 入 
A—CBR, | aR | CB| a 
B—CBR,B | aR,B| CBB | aB | b 
C—CBR,C | aR,C| CBC| aC| c 
R,—BR, | B 
引入 新 变量 R, 可 以 去 掉 左 递归 。 
S—AB | 入 
A—CBR, | aR, | CB| a 
B—CBR,B | aR,B| CBB| aB| b 
CaR,C | aC | c | aR,CR, | aCR, | cR, 
R,BR, | B 
R,BR, CR, | BCR, | BR,C| BC 
原来 的 变量 现在 满足 以 下 条 件 : 规则 右 侧 的 第 一 个 字符 或 者 是 终结 符 ， 或 者 是 序号 大 于 左 侧 的 变 
量 的 序号 的 变量 。 序 号 最 大 的 变量 ， 在 这 里 是 C， 必 须 在 每 条 规则 中 有 一 个 终结 符 作 为 第 一 个 字符 。 
下 一 个 变量 B， 必 须 有 C 或 者 终结 符 作 为 它 的 第 一 个 字符 。 以 变量 C 开始 的 8 规则 可 以 被 一 组 规则 蔡 
H, 根据 C 规 则 和 引 理 4.1.3， 这 些 规 则 要 以 终结 符 作 为 首 字符 。 完 成 上 述 转 换 ， 我 们 得 到 
S—AB | 入 
A—CBR, | aR, | CB| a 
B —aR,B| aB| b 
—aR, CBR,B | aCBR,B | cBR,B | aR, CR;BR,B | aCR,BR,B | cR,BR,B 
—aR, CBB | aCBB | cBB | aR, CR,BB | aCR,BB | cR,BB 
CaR,C | aC | c| aR,CR, | aCR, | cR, 
R,BR, | B 
R,—BR, CR, | BCR, | BR,C | BC. 
B 规则 的 第 二 列 是 通过 把 规则 B CBR,B 中 的 C 替换 得 到 的 ,第 三 条 是 替换 规则 。S 和 4 规则 必须 重 
写 从 而 去 掉 规则 右 部 初始 位 置 的 变量 。4 规则 中 的 替换 使 用 的 是 互 规则 和 C 规则 ， 这 几 条 规则 都 是 以 
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终结 符 开始 的 。4 规则 、 互 规则 和 C 规则 都 可 以 用 来 对 S 规则 进行 转换 ， 从 而 生成 
S 一 入 
—AaR,B | aB 
—4R, CBR,B | aCBR,B | cBR,B | aR, CR,BR,B | aCR,BR,B | cR,BR,B 
—4R, CBB | aCBB | cBB | aR, CR,BB | aCR,BB | cR,BB 
A—akR, | a 
— aR, CBR, | aCBR, | cBR, | aR, CR,BR, | aCR,BR, | cR,BR, 
—4R, CB | aCB | cB | aR, CR,B | aCR,B | cR,B 
B —aR,B | aB| b 
—4aR, CBR,B | aCBR,B | cBR,B | aR, CR,BR,B | aCR;BR,B | cR,BR,B 
—aR, CBB | aCBB | cBB | aR, CR,BB | aCR,BB | cR,BB 
C —aR,C | aC | c | aR,CR, | aCR, | cR, 
R,BR,| B 
R,—BR, CR, | BCR, | BR,C| BC. 
最 后 ， 蔡 换 过 程 必须 应 用 到 去 掉 直 接 递归 中 的 每 个 变量 上 。 重 写 这 些 规则 得 到 ， 
R, —aR, BR, | aBR, | bR, 
—4R, CBR, BR, | aCBR,BR, | cBR,BR, | aR, CR;BR,BR, | aCR,BR,BR, | cR,BR,BR, 
—4R, CBBR, | aCBBR, | cBBR, | aR,CR,BBR, | aCR,BBR, | cR,BBR, 
—4aR,B | aB| b 
—2R, CBR,B | aCBR,B | cBR,B | aR, CR;BR,B | aCR,BR,B | cR,BR,B 
—4aR, CBB | aCBB | cBB | aR, CR,BB | aCR,BB | cR,BB 
R, —aR,BR, CR, | aBR,CR, | bR,CR, 
—aR, CBR,BR,C R, | aCBR,BR,C R,| cBR,BR,C R,| aR,CR,BR,BR,C R,| aCR,BR,BR,C R, | 
cR,BR,BR, CR, 
—4R, CBBR, CR, | aCBBR, CR, | cBBR, CR, | aR,CR,BBR, CR, | aCR,BBR, CR, | cR,BBR, CR, 
R, —aR, BCR, | aBCR, | bCR, 
— aR, CBR, BCR, | aCBR, BCR, | cBR, BCR, | aR, CR, BR, BCR, | aCR,BR, BCR, | cR,BR, BCR, 
— aR, CBBCR, | aCBBCR, | cBBCR, | aR,CR,BBCR, | aCR,BBCR, | cR,BBCR, 
R, —aR,BR,C | aBR,C| bR,C 
—aR, CBR, BR,C| aCBR,BR,C| cBR,BR,C | aR,CR,BR,BR,C| aCR,BR,BR,C | cR,BR,BR,C 
—4aR, CBBR, C | aCBBR,C | cBBR,C | aR,CR,BBR,C| aCR,BBR,C | cR,BBR,C 
R, —aR,BC | aBC | bC 
—4aR, CBR,BC | aCBR,BC | cBR,BC | aR,CR,BR,BC| aCR,BR,BC | cR,BR,BC 
—4aR, CBBC | aCBBC | cBBC | aR, CR,BBC | aCR,BBC | cR,BBC. 
格 立 巴赫 范式 中 的 文法 失去 了 原 有 文法 G 的 所 有 简单 性 。 设 计 一 种 格 立 巴 赫 范式 形式 的 文法 几乎 
是 一 项 不 可 能 完成 的 任务 。 文 法 的 构造 应 该 使 用 简单 直观 的 规则 。 从 前 面 的 转换 过 程 可 以 看 出 , 把 任 
意 上 下 文 无 关 文法 转化 成 格 立 巴赫 范式 的 过 程 都 可 以 写成 算法 ， 因 此 可 以 使 用 设计 好 的 计算 机 程序 自 
动 完成 。 这 个 程序 的 输入 包括 任意 上 下 文 无 关 文 法 的 规则 ， 其 结果 是 等 价 的 格 立 巴赫 范式 文法 。 
应 该 指出 的 是 ， 使 用 引 理 4. 1. 3 中 的 替换 规则 可 能 会 产生 无 用 符 。 变 量 A 是 G 的 有 用 符号 ， 它 出 
现在 下 面 的 推导 中 


> 


S=AB=>aB=ab. 
在 向 格 立 巴赫 范式 转化 的 过 程 中 ， 替 换 会 去 掉 规 则 右 侧 所 有 出 现 的 4。 字 符 串 ab 由 等 价 的 格 立 巴赫 范 
式 按 下 面 的 过 程 生成 。 


S—aB-ab 


76 RZAD LH, AAMPBT 





定理 4.8.2 已 知 G 是 上 下 文 无 关 文 法 。 存 在 一 种 算法 可 以 用 来 构造 等 价 的 格 立 巴赫 范 式 形式 的 


上 下 文 无 关 文法 。 


证 明 : 用 来 构造 格 立 巴赫 范式 的 操作 已 经 被 证 明 可 以 用 来 产生 等 价 的 文法 。 所 有 这 些 就 是 为 了 证 
明 这 些 规则 总 可 以 进行 转化 ， 从 而 满足 替换 必须 的 条 件 。 这 就 需要 每 个 规则 都 有 下 面 的 形式 


或 


其 中 ， 下 角 标 表示 变量 的 序号 。 


对 变量 的 序号 进行 归纳 证 明 。 基 础 是 开始 符 ， 变量 的 序号 是 1。 因 为 8 不 是 递归 的 ， 所 以 显然 成 
立 。 现 在 假设 所 有 序号 不 超过 大 的 变量 都 满足 条 件 。 如 果 存 在 规则 A Aw, IFA i <k， 那 么 就 可 以 
替换 4， 从 而 生成 一 组 规则 ， 并 且 每 条 规则 都 形 如 A Aw, EP j>i, 如 果 必 须 的 话 重 复 这 个 过 程 
E 一 次 ， 从 而 生成 一 组 或 者 有 左 递归 或 者 具有 正确 形式 的 规则 。 所 有 直接 左 递归 的 变量 都 可 以 使 用 引 


理 4.7. 1 来 转换 。 


例 4.8.1 乔 姆 斯 基 范式 和 格 立 巴 赫 范 式 使 用 下 面 的 文法 进行 构造 : 


A—Aw, k«j 


A,—4aw, 


S—SaB | aB 
B—bB | ^. 


增加 一 个 非 递 归 的 开始 符 S', dedu 入 和 链 规则 ， 得 到 


乔 姆 斯 基 范 式 可 以 通过 前 面 规则 的 转换 获得 。 变 量 4 和 C 分 别 是 & 和 的 别名 ，7 表 示 字 符 串 aB。 


S' 一 SaB|SalaBla 
S—5SaB | Sa | aB| a 
B—bB | b. 


S'SST| SA | AB | a 
S—ST| SA| AB | a 
B—CB|b 

T—AB 

Aa 

Cb 


EEH S, S, B, T, AR C 来 编号 。 去 掉 左 递归 8 规则， 得 到 


这 些 规则 满足 条 件 : 规则 左 侧 的 变量 的 值 要 小 于 右 侧 第 一 位 置 的 变量 的 值 。 实 现 由 4 规则 和 C 规则 开 


始 的 替换 ， 则 会 产生 如 下 的 格 立 巴赫 范式 ; 


S'—AaBZT | aZT | aBT | aT | aBZA | aZA | aBA| aA | aB | a 


S'SST| SA | AB| a 
S—ABZ| aZ| AB | a 
B—CB|b 

T—AB 

Aa 

Cb ; 

Z—TZ| AZ| T| A. 


SaBZ | aZ| aB| a 


B—bB|b 
T—aB 
A—a 
Cb 


Z—4aBZ | aZ | aB |a. 
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下 面 的 表格 给 出 三 种 等 价 的 文法 中 ,字符 串 abaaba 的 最 左 推 导 。 








G 乔 姆 斯 基 范式 格 立 巴赫 范式 

S=SaB S'=SA S'—aBZA 

=SaBaB =STA —abZA 

—SaBaBaB —SATA —abaZA 

—aBaBaBaB —ABATA —abaaBA 

—abBaBaBaB —aBATA —abaabA 

—abaBaBaB —abATA —abaaba 

—abaaBaB —abaTA 

—abaabBaB —abaABA 

—abaabaB —abaaBA 

—abaaba —abaabA 

—abaaba 





乔 姆 斯 基 范 式 文 法 的 推导 过 程 中 产生 了 六 个 变量 。 每 个 变量 应 用 形 如 A—a 的 规则 都 可 以 转化 成 
终结 符 。 格 立 巴 赫 范 式 推导 使 用 每 个 规则 产生 一 个 终结 符 ， 它 仅仅 使 用 了 六 个 推导 过 程 就 完成 。 O 


4.9 练习 


从 练习 1 到 练习 5， 使 用 非 递归 的 开始 符 构造 等 价 但 不 缩小 的 文法 G.。 给 出 每 个 文法 产生 的 语言 的 正 
则 表达 式 。 





1.G: S—aS| bS| B 2. G: SSABC| X 
B—bb| C| X A-aA | a 
C—cC| X B—bB|A 

C—cC| X 

3.G. S—>BSA | A 4. G: S—AB| BCS 
A—>aA | X A—aA | C 
B—>Bba | X B—bbB | b 

C—cC| X 

5. G; S—ABC | aBC 
A—aA | BC 
B—bB|X 
C—cC| X 


6. 证 明 引 理 4. 3.2 
从 练习 7 到 练习 10， 构造 不 包含 链 规则 的 等 价 文法 Gc。 为 每 种 文法 产生 的 语言 写 出 正则 表达 式 。 注 意 
这 些 文法 不 包含 入 规则。 





7.G: S>AS| å 8$ G- SA TIBIC 

A—aA | bB| C Aaa | B 

B—>bB | b B—bb| C 

C—cC| B C—cc| A [138] 
9.G; SSA| C 10. G: SSAB| C 

A—aA |a| B A—aA | B 

B—>bB | b B>bB | C 

C—cC|c|B C—cClalA 


11. 消除 练习 1 中 文法 GL 中 的 链 规则 。 
12. 消除 练习 4 中 文法 G, 中 的 链 规则 。 
13. 证 明 算 法 4. 4. 2 能 够 生成 推导 出 终结 字符 串 的 变量 的 集合 。 
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从 练习 14 到 练习 16, 构造 没有 无 用 符 的 等 价 文法 。 跟 踪 用 来 构造 G+ Al Gu 的 TERM ftl REACH #4, 


描述 这 些 文法 产生 的 语言 。 

14. G; $—4AA | CD | bB 15. G; S—aA | BD 
AaA | a A—aA | aAB | aD 
B—bB | bC B—aB | aC | BF 
C—cB C—Bb|aAC|E 
D—4dD | d D—bD | bC| b 

E—aB | bC 
F—aF|aG|a 
G—a|b 

16. G: SACH | BB 
4 一 a4 | aF 
B—CFH|b 
CaC | DH 
D—aD | BD | Ca 
F—bB|b 
H—4dH | d 

17. 证 明 下 面 文法 的 所 有 字符 都 是 有 用 的 : 

G: S—A| CB 
AC|D 
B—bB|b 
C—cC| c 
D—>dD | d. 
MG 中 去 掉 链 规则 ， 构 造 它 的 等 价 文法 Gc. WEB] Gc 包含 无 用 符 。 
18. 把 下 面 的 文法 转化 成 乔 姆 斯 基 范 式 : 
: ^ G: S$—aA | ABa 
A—AA | a 
B—AbB | bb. 
G 已 经 满足 关于 开始 符 8$、 和 规则、 无 用 符 和 链 规则 的 条 件 了 。 
19. 把 下 面 的 文法 转化 成 乔 姆 斯 基 范式 。 
G: SeaABbB | ABC | a 
A—aA | a 
B—bBcC | b 
C—abc i 
G 已 经 满足 关于 开始 符 S、、 规则、 无 用 符 和 链 规则 的 条 件 了 。 
20. 把 练习 9 的 结果 转化 成 乔 姆 斯 基 范 式 。 


21. 
22. 
23. 


"24. 


把 练习 11 的 结果 转化 成 乔 姆 斯 基 范 式 。 
把 练习 12 的 结果 转化 成 乔 姆 斯 基 范 式 。 


把 下 面 的 文法 转化 成 乔 姆 斯 基 范 式 : 
G: S—4A | ABa | AbA 
A—4Aa | X: 
B—Bb| BC 
C—.CB | CA | bB. 
已 知 G 是 乔 姆 斯 基 范 式 的 文法 。 


a) L(G) 中 长 度 为 n 的 字符 串 的 推导 的 长 度 是 多 少 ? 
b) L(G) 中 长 度 为 n 的 字符 串 的 推导 树 的 最 大 深度 是 多 少 ? 


25. 


26. 


21. 


28. 


29: 


30. 


31. 


32. 


33. 
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c) L(G) PREW n 的 字符 串 的 推导 树 的 最 小 深度 是 多 少 ? 
当 输 入 字符 串 是 abbb 和 aabbb 时 ， 给 出 使 用 例 4. 5. 2 中 的 乔 姆 斯 基 范 式 文法 的 CYK 算法 产生 的 上 三 角 
和 矩阵。 
已 知 G 是 乔 姆 斯 基 范 式 文法 ， 如 下 
SAX | AY| a 
X—AX |a 
Y—BY| a 
A—a 
Bb. 
给 出 使 用 该 文法 且 输 入 串 是 baaa 和 abaaa 时 的 CYK 算法 产生 的 上 三 角 矩 阵 。 
已 知 G 是 下 面 的 文法 
G: SSA| B 
A—aaB | Aab | Aba 
B—bB | Bb | aba. 
a) 给 出 L(G) 的 正则 表达 式 。 
b) 构造 与 G 等 价 的 不 包含 左 递归 规则 的 文法 G'。 
构造 不 包含 左 递归 规则 且 等 价 于 下 面 文法 的 文法 G: 
G: S>A| C 
A—AaB | AaC | B | a 
B—Bb | Cb 
C—cC | c. 
给 出 字符 串 aaccach 在 文法 G 和 G“ 中 的 最 左 推导 。 
构造 不 包含 左 递归 规则 且 等 价 于 下 面 文法 的 文法 G' : 
G: S>A|B 
A—4AAA | a| B 
B—BBb | b. 
构造 等 价 于 下 面 文法 的 格 立 巴赫 范式 : 
S—aAb | a 
4 一 SS | b. 
把 乔 姆 斯 基 范 式 
S—BB 
A—AA | a 
B—4AA | BA| b 
转化 成 格 立 巴赫 范式 。 处 理 变量 的 顺序 是 S，4，B。 
把 乔 姆 斯 基 范 式 
S—AB | BC 
A—AB | a 
B—4AA| CB|b 
Ca | b 
转化 成 格 立 巴赫 范式 。 处 理 变 量 的 顺序 是 3S，4，B，C。 
把 乔 姆 斯 基 范 式 
SBA | AB| X 
ABB | AA|a 
B—4AA|b 
转化 成 格 立 巴赫 范式 。 处 理 变量 的 顺序 是 S，4，B。 


141 


80 GBD LH, AAMPBS 





34. 把 乔 姆 斯 基 范 式 
S—AB 
ABB | CC 
B—4AD | CA 
Ca 
D-b 
转化 成 格 立 巴赫 范式 。 处 理 变量 的 顺序 是 83，4，B，C，D。 
“35. 证 明 每 个 上 下 文 无 关 语 言 都 是 使 用 具有 下 面 形式 的 规则 的 文法 生成 的 : 
i) Sr 
ii) Aa 
ii) AaB, KH 
iv) A—aBC 
142 其 中 AeV, B, CeV-|S\3#Hacd, 


参考 文献 注释 


消除 入 规则 和 链 规则 的 构造 过 程 参见 Bar-Hillel, Perles 和 Shamir [1961], 乔 姆 斯 基 范式 是 乔 姆 
斯 基 [1959] 提出 的 。CYK 算法 是 以 JI Cocke, D. Younger [1967] 以 及 独立 提出 这 种 确定 可 推导 性 
技术 的 工 Kasami 的 名 字 命 名 的 。 这 个 算法 的 变形 可 以 用 于 解决 任意 上 下 文 无 关 文 法 的 成 员 问题 ， 而 
不 需要 把 它 转化 成 乔 姆 斯 基 范 式 。 

格 立 巴赫 范式 是 Greibach [1965] 提出 的 。 格 立 巴赫 范式 的 另 一 种 转换 限制 了 结果 文法 中 的 规则 
的 数目 的 增长 ， 详 见 Blum 和 Koch [1999] 。 格 立 巴 替 范 式 的 定义 有 几 种 变形 。 通用 的 公式 表示 要 求 
终结 符 要 出 现在 字符 串 的 第 一 个 位 置 ， 但 是 允许 字符 串 的 剩 下 部 分 包含 变量 和 终结 符 。 双 格 立 巴 赫 范 
式 ，Engelfriet [1992] ， 要 求 规则 右 侧 的 最 左 和 最 右 符号 都 是 终结 符 。 

规则 满足 练习 35 的 条 件 的 文法 可 以 称 作 是 2- 范 式 。 产 生 整 个 上 下 文 无 关 语 言 的 集合 的 2- 范式 文 
法 证 明 参 见 Hopcroft, Ullman [1979] 和 Harrison [1978], Harrison [1978] 给 出 了 上 下 文 无 关 文 法 
144| 的 另 一 种 范式 。 
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BOS ”有 限 自 动机 


本 章 我 们 将 介绍 被 称 为 有 限 状 态 自动 机 的 一 类 抽象 计算 装置 。 有 限 状 态 自 动机 是 用 来 判定 一 个 字 
符 串 是 否 满足 一 组 条 件 ， 或 者 是 否 匹 配 一 个 规定 的 模式 。 有 限 状 态 自 动机 和 许多 机 械 装 置 具有 一 些 共 
同 的 性 质 : 它们 对 输入 进行 处 理 并 产生 输出 。 一 台 自 动 售 货 机 将 硬币 作为 输入 ， 并 返回 食物 或 者 饮料 
作为 输出 。 一 个 号 码 锁 期 望 一 串 数 字 ， 如 果 输 入 了 正确 的 数字 串 将 会 打开 锁 。 有 限 状 态 机 的 输入 是 一 
个 字符 串 ， 运 算 的 结果 指出 有 限 状 态 自动 机 是 否 接收 该 串 。 有 限 状态 自动 机 接收 的 串 的 集合 构成 了 自 
动机 的 语言 。 

前 面 的 机 器 的 例子 展示 机 械 计算 的 一 个 性 质 : 确定 性 。 当 投放 适当 数量 的 钱 到 自动 售 货 机 中 时 ， 
如 果 任 何事 情 都 不 发 生 我 们 将 非常 担心 。 同 样 ， 我 们 期 望 一 个 输入 的 组 合 可 以 打开 锁 ， 而 其 他 的 序列 
不 能 打开 。 最 初 ， 我 们 要 求 有 限 状 态 自动 机 具有 确定 性 。 之 后 我 们 将 放宽 这 个 条 件 ， 来 检查 非 确定 性 
对 有 限 状 态 计算 的 能 力 的 影响 。 


5. 1 一 个 有 限 状 态 自动 机 


一 个 机 器 的 形式 定义 与 该 机 器 操作 中 涉及 的 硬件 无 关 ， 但 是 却 与 机 器 处 理 输入 时 进行 的 内 部 操作 
的 描述 相关 。 一 个 自动 售 货 机 可 能 由 若干 个 控制 杆 、 带 制 动 栓 的 号 码 锁 ， 以 及 一 个 由 微 处 理 器 控制 的 
电子 输入 系统 构成 ， 但 是 不 管 哪 种 机 器 ， 它 们 都 接收 输入 ， 并 产生 肯定 的 或 否定 的 响应 。 什 么 描述 能 
够 包含 这 些 看 起 来 是 不 同类 型 的 机 械 计算 的 功能 ? 

采用 一 个 简单 的 可 以 在 很 多 街角 看 到 的 报纸 自动 售卖 机 来 描述 一 个 有 限 状 态 机 器 的 各 个 组 件 。 机 
器 的 输入 可 以 是 S 美 分 ，10 美 分 和 25 美 分 的 硬币 。 当 插入 了 30 美 分 ， 机 器 的 盖子 打开 ， 并 可 以 拿 走 
一 份 报纸 。 如 果 硬 币 的 总 数 超过 了 30 美 分 ， 机 器 优雅 地 接收 多 给 的 钱 ， 不 找 回 零钱 。 

大 街角 落 处 的 报纸 售卖 机 没有 记忆 ， 至 少 不 具 有 我 们 通常 想象 中 的 计算 机 器 中 的 存储 器 。 但 是 机 
器 “知道 ”， 如 果 已 经 插 和 人 了 25 美 分 ， 当 再 插入 5 美 分 的 时 候 ， 机 器 的 盖子 将 会 打开 。 这 些 知 识 要 求 
机 器 在 接收 并 处 理 完 输入 的 时 候 ， 可 以 改变 自身 的 内 部 状态 。 

机 器 状态 表示 正在 进行 的 计算 的 情况 。 下 面 的 7 个 状态 之 间 的 交互 可 以 描述 自动 售卖 机 的 内 部 操 
作 。 用 楷体 表示 出 来 的 状态 的 名 字 指 明了 朝 着 打开 盖子 目标 进展 的 过 程 。 


需要 30 KD: 没有 插入 任何 硬币 的 机 器 状态 

需要 25 美 分 : 输入 1 个 5 美 分 硬币 后 的 状态 

需要 20 美 分 : 输入 2 个 5 美 分 或 者 1 个 10 美 分 硬币 后 的 状态 

需要 15 美 分 : 输入 3 个 5 美 分 或 者 1 个 10 美 分 和 1 个 5 美 分 硬币 后 的 状态 

需要 10 美 分 : 输入 4 个 5 美 分 或 者 1 个 10 美 分 和 2 个 5 美 分 或 者 2 个 10 美 分 后 的 状态 
需要 5 美 分 : 输入 1 个 25 美 分 或 者 5 个 5 美 分 或 者 2 个 10 美 分 和 1 个 5 美 分 或 者 1 个 10 美 分 
和 3 个 5 美 分 后 的 状态 

e 需要 0 美 分 : 表示 至 少 输入 了 30 美 分 的 状态 


插入 一 个 硬币 导致 机 器 改变 状态 。 当 30 或 更 多 美 分 输入 后 ， 进 入 需要 0 美 分 状态 ,并 且 锁 打开 。 
这 个 状态 称 为 接收 状态 ， 因 为 它 表 明 输 入 正确 。 

设计 自动 机 的 时 候 ， 必 须 用 符号 表示 每 一 个 构件 。 抽 象 机 器 的 输入 是 一 串 符号 而 不 是 一 串 硬 币 。 
通常 采用 一 个 带 标记 的 有 向 图 ， 称 为 状态 图 (State Diagram) ， 来 表示 机 器 的 内 部 转换 。 状 态 图 的 节 
点 表示 上 面 所 描述 的 状态 。 在 状态 图 中 ， 简 单 地 用 m 表示 需要 m 美 分 的 节点 。 计 算 开始 时 机 器 的 状 
态 为 XD。 报纸 售卖 机 的 初始 状态 为 节点 30。 
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. MERREN, diÀdiq, 分 别 表示 输入 的 是 5 美 分 、10 美 分 或 者 25 美 分 的 硬币 。 从 节点 x 到 
节点 y 的 标记 为 v 的 弧 表 示 ， 当 机 器 在 状态 x 时 处 理 输入 v 将 使 机 器 进入 状态 y。 图 5-1 给 出 了 报纸 售 
卖 机 的 状态 图 。 从 节点 15 到 节点 5 的 标记 为 d 的 弧 表 示 了 ， 机 器 在 处 理 了 前 面 的 15 美 分 的 之 后 再 输 
A 10 美 分 时 的 机 器 状态 的 改变 。 节 点 0 到 自身 、 长 度 为 1 的 弧 表 示 当 总 数 超过 30 美 分 后 ， 任 何 的 输 
人 都 将 使 锁 保持 打开 状态 。 





图 5-1 报纸 售卖 机 的 状态 图 


机 器 的 输入 由 |n，d，gq|}“ 中 的 串 组 成 。 处 理 输入 串 的 过 程 中 进入 的 状态 序列 可 以 通过 跟踪 状态 
图 中 的 弧 获 得 。 计 算 开始 时 ， 机 器 在 初始 状态 。 经 过 标记 为 第 一 个 输入 符号 的 弧 ， 得 到 了 机 器 状态 的 
子 序列 。 处 理 输 入 串 中 的 下 一 个 符号 时 ， 在 当前 的 状态 经 过 适当 的 弧 到 达 前 面 弧 的 目标 节点 。 重 复 这 
个 过 程 直到 输入 串 全 部 被 处 理 完 。 如 果 计 算 终 止 在 接收 状态 ， 则 接收 输 大 串 。 串 dndn 能 够 被 自动 售 
卖 机 接收 ， 而 串 nndn 不 被 接收 ， 因 为 计算 终止 在 状态 5。 


5.2 确定 型 有 限 自动 机 


自动 售卖 机 的 分 析 需 要 将 设计 的 基本 原理 从 实现 细节 之 中 分 离 出 来 。 这 种 独立 于 实现 的 描述 通常 
叫做 抽象 机 器 。 下 面 将 介绍 一 类 抽象 机 器 ， 它 们 的 计算 可 以 用 来 决定 是 否 接收 输入 串 。 

定义 5.2.1 确定 型 有 限 自动 机 (DFA) 是 一 个 五 元 组 M= (Q, 研 ,5,g,E)， 其 中 Q 是 一 个 有 限 
状态 集合 ; 也 是 一 个 有 限 字 母 表 ; HeQ, qu 称 为 初始 状态 ; 下 是 Q 的 子 集 ， 称 为 终结 状态 集 或 者 接 
收 状态 集 ; 8 是 一 个 从 Qx TA QUA HH, MER SE, 

我 们 把 一 个 确定 型 有 限 自动 机 看 作 一 个 抽象 机 器 。 为 了 揭示 确定 型 有 限 自 动机 的 机 器 本 质 ， 我 们 
可 以 使 用 许多 熟悉 的 计算 机 器 中 的 构件 来 描述 DFA 的 操作 。 一 个 自动 机 包含 五 个 组 件 ， 一 个 内 部 寄 
存 器 ,一 组 寄存 器 值 ， 一 个 带 ， 一 个 带 读 取 器 和 一 个 指令 集 。 

我 们 通常 用 DFA 的 状态 来 表示 机 器 的 内 部 情形 ， 记 为 g,，g, ，gq,，…，g,。 机 器 的 寄存 器 ， 也 称 
为 有 限 控制 器 ， 包 含 一 个 状态 值 。 计 算 开始 时 ， 寄 存 器 的 值 为 DFA 的 初始 状态 qu. 

DFA 的 输入 是 字母 表 习 中 元 素 的 一 个 有 限 序列 。 带 上 存储 输入 ， 直 到 计算 使 用 这 些 输入 。 带 被 分 
成 了 许多 的 方 格 ， 每 一 个 方 格 能 够 容纳 字母 表 中 的 一 个 元 素 。 由 于 输入 串 的 长 度 没有 上 限 ， 所 以 带 也 
必须 没有 长 度 的 限制 。 自 动机 一 次 计算 的 输入 放置 在 带 的 一 个 初始 段 之 中 。 

带头 读 取 输 入 带 的 一 个 方 格 。 机 器 的 主体 包含 带头 和 寄存 器 两 个 部 分 。 将 主体 放 在 正在 扫描 的 带 
方 格 下 面 ， 这 样 就 指明 了 带头 的 位 置 。 寄 存 器 的 值 表示 自动 机 当前 的 
状态 。 输 入 为 baba 的 计算 的 初始 配置 描述 如 下 Pal bebo | = 

自动 机 的 计算 包括 执行 一 序列 的 指令 。 执 行 一 条 指令 将 改变 机 器 
的 状态 并 将 带头 向 右 移动 一 个 方 格 。 指 令 集 从 DEA 的 转换 函数 中 获 | % | 
得 。 机 器 状态 和 扫描 到 的 符号 决定 将 要 执行 的 指令 。 自 动机 在 状态 q 
下 扫描 到 a 的 动作 是 将 状态 设置 为 6(q,,a) 。 因 为 6 是 一 个 全 函数 ， 每 一 个 状态 和 输入 符号 的 组 合 对 
应 惟一 的 指令 ， 所 以 确定 型 有 限 状 态 自 动机 是 确定 的 。 

自动 机 计算 的 目的 是 确定 输入 串 是 否 能 够 被 自动 机 接收 计算 开始 时 ， 带 头 扫描 带 的 最 左边 的 方 
格 ， 此 时 寄存 器 之 中 含有 状态 g,。 根 据 状态 和 扫描 到 的 符号 选择 指令 。 之 后 ， 机 器 改变 为 指令 所 给 出 
的 状态 ， 带 头 右 移 。 每 个 指令 周期 中 机 器 的 转换 如 图 5-2 所 示 。 指 令 周 期 重复 直到 带头 扫描 到 空白 方 
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格 ， 此 时 计算 终止 。 如 果 计算 终止 在 接收 状态 ， 那 么 接收 输入 串 ; 和 否则， 不 接收 输入 串 。 图 5-2 展示 


了 接收 串 aba 的 过 程 。 

JEM 5.2.2 M=(Q, 荆 ,5,q,,EF) 是 一 个 DFA。M 的 语言 (Lan- 
guage), i67; L(M) , XX," 上 能 够 被 M 接收 的 串 的 集合 。 

DFA 可 以 被 看 作 是 一 个 语言 的 接收 器 ; 简单 地 说 ， 机 器 的 语言 就 是 
能 够 被 机 器 的 计算 接收 的 串 的 集合 。 图 5-2 中 的 机 器 的 语言 是 | a,p} 上 
的 所 有 以 a 结尾 的 字符 串 的 集合 。 

DFA 是 一 个 从 左 到 右 处 理 输 入 的 只 读 机 器 ; 一 旦 输入 字符 被 读 入 ， 
它 将 不 再 影响 计算 。 在 计算 的 任何 时 候 ， 计 算 的 结果 只 依赖 于 当前 的 状 
态 和 未 处 理 的 输入 。 这 种 组 侣 叫做 机 器 格局 (Machine Configuration) , 
RRIA X q, wW), EP a; 是 当前 状态 ，w e X ' 是 未 处 理 的 输入 。 
DFA 的 一 个 指令 周期 将 一 个 机 器 格局 转换 到 另 一 个 机 器 格局 。 记 号 
[q,, aw] hr(qj, w] s BL LM 在 格局 [gq;,，aw] 时 ， 可 以 通过 执行 
自动 机 M 的 一 个 指令 周期 而 获得 格局 [4%，w]。 记 号 be, ER “IT 
生 ”， 和 定义 了 一 个 从 QxzZ 到 QxzZ 的 函数 ， 它 可 以 用 来 跟踪 DFA 的 
计算 。 如 果 没 有 歧义 我 们 将 省 略 M。 

定义 5.2.3 Qx LD 上 的 函数 环 定 义 如 下 。 对 任意 的 we 二 ， 
we 有 "有 

[q aw] br [8(q,,a) ,w] 

其 中 , 6 是 DFAM 的 转换 函数 。 

记号 [gq;,uj] F- [qj v ] ZR Waal q; ,uj 可 以 通过 零 步 或 者 多 步 转换 
获得 格局 [ qj;,v]。 


例 5.2.1 下 面 定义 的 DFA M 可 以 接收 |a,b| 上 的 所 有 含有 bb 子 串 的 字符 串 的 集合 。 


(aUb) 'bb(aUb) ' ~ M 的 状态 和 字母 表 为 : 


Q= {qoq 9! 
= {a,b} 


zig. 


转换 函数 6 以 二 维 表格 的 形式 给 出 ， 叫 做 转换 表 。 垂 直方 向 是 状态 ， 水 平方 向 是 字母 表 。 自 动机 在 状 


AS 4 时 输入 a 的 动作 可 以 通过 查找 q; TT. a 列 处 的 内 容 决定 。 





下 面 采 用 函数 = 跟踪 M 对 输入 串 abba 和 abab 的 计算 。 


[ qo, abba] [qs, abab] 
k [4q, bba] klao, bab] 
Egr ba] - [q,, ab] 
H Taa] H [4. 5] 
Ele, X] La. X] 

接收 拒绝 


因为 计算 终止 在 状态 9 ， 所 以 串 abba 被 接收 。 


例 5.2.2 前 一 节 的 报纸 售卖 机 可 以 表示 成 一 个 DFA， 它 的 状态 、 字 和 母 表 和 转换 函数 如 下 。 开 始 


状态 在 30。 


M: Q-(q, 9;} ô (Jo a)74, 
X-(a, b} 5 (qo, b)-4, 
F={q,} ô (q, a)74, 

ô (q,, b)-4, 


中 5-2 DFA 中 的 计算 


口 


BU, L(M) = 


[149] 
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Q= [0,5,10,15,20,25;30] ón 
Y -|n,d,q| 0 | 0 
F={0} 5 178 

2 





QOO Oo S ps 


30, 25 p^ 
售卖 机 接收 的 语言 是 所 有 表示 的 和 超过 30 美 分 的 串 。 你 能 够 构造 一 个 定义 该 机 器 的 语言 的 正则 表达 
式 吗 ? 口 

转换 函数 详细 说 明了 机 器 在 任何 给 定 的 状态 和 字母 表 中 的 元 素 时 的 动作 。 这 个 函数 可 以 扩展 成 
8， 它 的 输入 包括 一 个 状态 和 字母 表 上 的 一 个 串 。 函 数 Â 可 以 通过 递归 地 将 范围 从 并 中 的 元 素 扩展 到 
任意 长 度 的 串 来 构造 。 

定义 5.2.4 DFA 转换 函数 5 的 扩展 转换 函数 (extended transition function) 8 ZA Qx X` 5| Q 
的 函数 。8 的 值 由 输入 串 的 长 度 递归 地 定义 。 

i) 归纳 基础 : length(w)=0, ®Aw=r, 并 且 6(g,, 和 A) =g,， 

length(w) 21, RA STET ae Yd wza, 3t B. 8(q,,a) =6(q,,a) 

ii) 递归 步骤 : Rw 是 长 度 为 n>1 的 事 ,， 那么 w=ua, 并 且 8(q,.ua) 28(8(q,,u) ,a) 

机 器 在 状态 q, 输入 串 w 的 计算 将 停止 于 状态 6( gq,,w) o RA SC w 的 价值 在 于 ， 它 模拟 了 重复 
应 用 处 理 输入 串 w 时 所 需要 的 转换 函数 的 过 程 。 如 果 6( gq,,w) eF, WAR w 被 接收 。 使 用 这 个 记 
号 ，DFA M 的 语言 可 以 表示 为 L(M) = |w| 8(q,w) eF|。 


5.3 状态 图 和 例子 


DFA 的 状态 图 是 一 个 带 标 记 的 有 向 图 ， 图 的 节点 表示 机 器 的 状态 ， 图 中 的 弧 是 通过 转换 函数 获得 
的 。 图 5-1 是 报纸 售卖 机 DFA 的 状态 图 。 由 于 图 的 直观 性 ， 我 们 经 常 采用 状态 图 而 不 是 集合 和 转换 函 
数 的 形式 来 表示 DFA 的 形式 定义 。 

定义 5.3.1 DFA M=(Q,,6,go,F)， 是 一 个 有 向 图 G， 它 满足 如 下 的 条 件 ;: 

i) G 的 节点 是 Q 的 元 素 。 

i) G 中 弧 上 的 标记 是 半 中 的 元 素 。 

iii) q AFHI E, ATRA O., 

iv) F 是 接收 节点 的 集合 , 每 一 个 接收 节点 表示 为 @。 

v) 如 果 5(qi,a) =q, NEEEM q, 到 q, 的 标记 为 a HH, 

vi) 对 每 一 个 节点 9 和 ae 二 ,存在 惟一 的 一 条 以 q 为 起 点 的 标记 为 a 的 弧 。 

DFA 的 一 个 转换 表示 为 状态 图 中 的 一 条 弧 。 在 DFA 相应 的 状态 图 中 ,通过 追踪 DFA 的 计算 可 以 
构造 出 一 条 以 节点 qo 为 起 点 且 弧 上 上 的 标记 为 输入 串 的 路 径 s ME p, 是 一 条 以 q 为 起 点 标记 为 w 的 路 
径 ，gq, 是 该 路 径 的 终止 节点 。 定 理 5. 3.2 将 证 明 对 每 一 个 串 we Y" 存在 惟一 的 一 条 这 种 路 径 。 此 外 ， 
q, 是 DFA 处 理 w 结束 时 的 状态 。 

定理 5.3.2. 设 DFAM=(Q,Z,5,q,FE)，mwez'。 那 么 w 决 定 M 的 状态 图 上 惟一 的 一 条 路 径 
p, 并 且 êl w) =yo 

TEAR: 通过 对 串 的 长 度 进行 归纳 来 证 明 该 定理 。 如 果 w 的 长 度 为 0， BBA 8(m ,入 ) = qus XERZIU 
路 径 是 一 条 空 路 径 ， 开 始 和 终止 节点 都 是 qo。 

假设 结论 对 所 有 长 度 小 于 或 者 等 于 元 的 串 都 成 立 。 设 ow = wa BREA ndm, 
由 归纳 假设 可 知 ,存在 惟一 的 路 径 p,， 该 路 径 上 的 标记 为 &， 并 且 8(q ,xz) 2 4,. PETS p, THWR q 
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标记 为 a 的 弧 构 造 。 这 是 一 条 从 gp 出 发 的 标记 为 w 的 惟一 的 路 径 ， 因 为 p, 是 标记 为 u 的 惟一 路 径 ， 
并 且 从 q, 出 发 民有 一 条 标记 为 a 的 弧 。 路 径 p, 的 终止 状态 由 转换 5( g,,a) 决定。 根据 扩展 转换 函数 
的 定义 可 得 6(go,w) 28(8(qo,u) ,a)。 因 为 6(g0,u) =g,, 所 以 q, =6(g,,a) =8(8(q,u),a) = 


lq w), WEE, E 
DFA 的 计算 和 状态 图 中 的 路 径 的 等 价 性 ， 给 我 们 了 一 个 确定 DFA 的 语言 的 启发 式 的 方法 。 状 态 
q: 接收 的 串 就 是 从 g 到 q: 的 所 有 路 径 上 的 标记 。 我 


们 可 以 将 这 个 过 程 分 离 成 两 部 分 : 
i) 首先 ， 找 到 从 q 第 一 次 到 达 q; HAA BA 
正则 表达 式 u,, ++, Uno 
ii) 找到 所 有 离开 q 后 又 回 到 gq; 的 路 径 的 正则 
表达 起 Vs rn, Vao 
则 状态 q; 接收 的 串 为 (WU*…Uu)(viU…Uv,)”。 
考虑 DFA M (WAR) 的 语言 由 所 有 从 qo 出 Q 
发 到 达 gq 或 者 a, 的 路 径 的 标记 组 成 。 采 用 前 面 的 启 
发 式 的 描述 ， 到 每 一 个 接收 状态 的 串 是 : 











状态 到 q; 的 路 径 从 9i 到 4; 的 简单 回路 接受 的 串 
4i a b ab* 
93 ab*aa* b, bb*a bb* a, aa* b (ab* aaUba) (abUba) * 


因此 ,， LCM) =ab* U(ab' aa! bUbb' a) (aa bUbb' a) 。 当 我 们 确定 了 有 限 状 态 计 算 的 其 他 性 质 之 
后 ， 将 给 出 一 个 能 够 自动 产生 有 限 自动 机 语言 的 正则 表达 式 的 算法 。 
接 下 来 我 们 将 通过 具体 例子 来 帮助 设计 检查 具有 一 定 模 式 的 串 的 自动 机 。 我 们 将 要 考虑 的 情形 包括 出 
现 次 数 以 及 指定 子 串 的 相对 位 置 。 此 外 ， 我 们 还 要 确定 接收 语言 L 和 工 的 补 的 DFA 之 间 的 关系 。 

例 5.3.1 例 5.2.1 中 的 DFA 的 状态 图 如 下 : : 


a a,b 
go 
这 些 状态 用 来 记录 处 理 到 的 连续 的 忆 的 个 数 。 当 遇 到 二 个子 串 丰 一 计算， HE 
时 ， 自 动机 将 进入 状态 4,。 一 旦 自动 机 进入 状态 q, 接 下 来 处 理 [go, ababb | do. 
的 输入 将 不 会 改变 自动 机 的 状态 。 这 个 DFA 对 输入 ababb 的 计算 | (4o. babb] qo, 
和 状态 图 中 相应 的 路 径 如 右 表 所 示 。 串 ababb 能 够 被 接收 ， 因 为 计 in, A E 
算 的 终止 状态 是 接收 状态 4,， 它 也 是 具有 标记 ababb 的 路 径 的 终止 T10 m PR 
状态 。 D Lr, d; 
例 5.3.2 DFA 


b a,b 
= ah 
B 
b 


Bellt(bUab) ' (aUX), Bllla,b] 上 的 所 有 不 包含 子 串 aa 的 串 的 集合 。 
$15.3.3 Bei {a,b} LAAT bb MARGATE aa 的 串 的 DEA. 的 描述 如 下 。 该 语言 是 前 面 
两 个 例子 的 语言 的 并 集 。 
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图 


和 接收 两 个 语言 的 并 集 的 机 器 相 比较 ， 接 收 含 子 串 bb 或 者 不 含 子 串 aa 的 机 器 的 状态 图 看 起 来 要 
简单 些 。 看 上 去 不 存在 一 种 直接 的 通过 组 合 两 个 已 知 DFA 的 状态 图 ,来 构造 一 个 所 要 求 的 复杂 的 机 
器 的 方法 。 

下 面 的 几 个 例子 将 为 设计 DFA 提供 启发 。 第 一 步 是 获得 一 个 DFA 状态 的 解释 ， 状 态 的 解释 描述 
了 当 自 动机 处 于 该 状态 时 已 经 被 处 理 的 串 的 性 质 。 相 关 的 性 质 由 接收 一 个 串 所 需要 的 条 件 来 决定 。 

例 5.3.4 一 个 接收 {a,b} 上 的 含有 子 串 aaa 的 串 的 DFA 一 下 一 一 一 一 一 一 一 一 一 





的 一 次 成 功 计算 必须 处 理 连续 的 3 个 a。 需 要 4 个 状态 来 记录 zm TT PES 

计算 检查 串 aaa 的 情形 。 状 态 的 解释 和 名 字 见 右 表 。 a: ”处 理 的 最 后 一 个 字符 是 4 
在 处 理 第 一 个 符号 之 前 ， 没 有 处 理 查找 aaa 的 过 程 。 因  ”%%: ”处 理 的 最 后 两 个 字符 是 aa 

此 ， 这 个 条 件 表示 了 初始 状态 。 Bisa LERRA ae 


一 旦 状态 被 标识 ， 那 么 通常 很 容易 决定 适当 的 转换 。 当 计算 在 状态 q 处 理 了 一 个 a 且 最 后 读 取 的 
两 个 字符 是 aa 时 ， 则 进入 2 。 另 一 方面 ， 如 果 在 状态 q, 读 和 2， 那么 结果 串 表 示 前 面 没有 处 理 过 的 
aa4， 计 算 进 入 go。 根 据 相 似 的 策略 ， 可 以 为 DFA 的 所 有 状态 决定 转换 。 


o 






一 旦 处 理 aaa， 则 计算 进入 % ， 读 入 剩余 的 串 ， 并 接收 输入 。 O ”状态 解释 
例 5.3.5 构造 一 个 只 接收 含有 两 个 a 和 奇数 个 b 的 串 的 自动 d: . Xa, 偶数 个 6 
机 ， 需 要 检查 两 个 条 件 : a 的 个 数 和 也 个 的 数 的 奇偶 性 。 需 要 7 OR 4: Aa, BRT b 





态 来 存储 这 个 串 的 信息 。 状 态 的 解释 描述 了 读 人 a 的 个 数 和 处 理 的 ， P: Yen ste 
UE. PED 

在 计算 开始 时 ， 没 有 a Mb 被 处 理 ， 这 成 为 开始 状态 的 条 件 。 接 So 2 个。 eap 
收 这 个 语言 的 DFA 如 下 : p Ra. 





水 平 缴 记 录 输 入 串 中 a 的 个 数 ， 垂 直 的 几 对 弧 记 录 b 的 奇偶 性 。g 是 接收 状态 ， 因 为 它 表示 了 语言 中 
的 串 所 需要 的 条 件 。 o 
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HI 5.3.6 BY ={0,1,2,3}, X" PATHE X PMS, DEA 决定 输入 串 中 各 位 数字 
的 和 能 和 否 被 4 整除 。 例 如 ， 串 12302 和 0130 能 够 被 M Be 0 


收 ，0111 将 被 M 拒绝 。 状 态 表示 了 已 经 处 理 的 输入 的 和 
1 
Ct 






模 4 的 值 。 口 

DFA 的 定义 只 允许 有 两 种 可 能 的 输出 ， 接 收 或 者 拒 
绝 。 答 出 可 以 扩展 为 每 个 状态 关联 二 个 值 。} 计 算 的 结果 是 
与 计算 终止 状态 关联 的 值 。 这 种 类 型 的 机 器 叫做 Moore 
机 ， 因 为 这 种 类 型 的 有 限 状态 计算 是 由 E. F. Moore 引入 。 
将 值 i 与 状态 imod 4 相关 联 ， 例 5.3.6 中 的 机 器 将 扮演 一 
个 模 加 法 器 。 

例 5.3.1、 例 5.3:2 和 例 5.3.3 的 机 器 的 状态 图 显示 ， 
不 存在 一 种 简单 的 方法 ， 采 用 这 种 方法 我 们 可 以 从 两 个 分 0 5 
别 接收 两 种 语言 的 DFA 构造 一 个 接收 这 两 种 语言 的 并 的 DFA。 下 面 的 两 个 例子 将 展示 接收 补 集 的 机 
器 的 不 同情 况 。 一 个 DEA 的 状态 图 可 以 很 容易 地 转换 为 另 一 个 接收 并 且 只 接收 该 DFA 拒绝 接收 的 串 
的 自动 机 的 状态 图 。 

例 5.3.7 DFA M 接收 |a,2 上 所 有 包含 偶数 个 a 和 奇数 个 b WR, 

在 计算 的 任何 一 步 ， 根 据 输 入 符号 个 数 的 奇偶 性 有 四 种 可 能 的 组 合 : (1) 偶数 个 a， 侦 数 个 b， 
(2) 偶数 个 a， 奇 数 个 bp，(3) 奇数 个 a, 偶数 个 bp，(4) 奇数 : 
Aa, 奇数 个 b。 可 以 用 一 个 有 序 对 表示 这 四 种 状态 ， 有 序 对 的 六 
第 一 部 分 表示 a 的 奇偶 性 ,第 二 部 分 表示 b 的 奇偶 性 。 每 处 理 
一 个 符号 都 将 改变 其 中 的 一 个 部 分 ， 由 此 可 以 设计 出 适当 的 
转换 。 ' " 

$|5.3.8 设 M 是 例 5.3.7 中 构造 的 DFA。DFA M' 被 构造 
为 接收 [a,b| 上 的 所 有 不 含 奇数 个 a 和 偶数 个 b 的 串 。 换 而 言 之 ， 
BLOM’) = {a,b} * -L(M)。 任何 被 M 拒绝 的 串 将 被 M' 接 收 ， 反之 亦 然 。M' 的 状态 图 可 以 通过 交换 
M 的 接收 和 非 接收 状态 获得 。 口 

前 面 的 例子 说 明了 接收 互补 串 的 集合 的 DFA 之 间 的 关系 。 下 M^ 
面 的 定理 对 该 关系 进行 了 形式 化 。 

定理 5.3.3 jit DFAM=(Q,>,6,q,F), MAM’ =(Q,2, 
8,4,,Q0- F)£ —^ DFA, 并 且 L(M') - E" -L(M), 

证 明 : wed’, 是 由 5 构造 的 扩展 转换 函数 。 对 每 一 个 
weL(M), 有 6(go,w) EF, U, wgL(M')。 相 反 ,， 如 果 w 
L(M), Jil 8(q,,w) eQ-FJEÉH weL(M’), m 

HEX, DFA 必须 处 理 完 所 有 的 输入 ， 甚 至 在 结果 已 经 确定 的 情况 下 仍 需 如 此 。 例 5. 3.9 展示 了 
另 一 种 确定 性 ， 有 时 称 为 不 完全 确定 ; 每 一 个 格局 至 多 具有 一 个 动作 。 该 自动 机 的 转换 是 由 从 Q X X 
到 Q 上 的 一 个 部 分 函数 定义 。 一 旦 能 够 决定 串 是 否 被 接收 ， 计 算 就 停止 。 在 处 理 完整 个 输入 前 就 终止 
的 计算 将 拒绝 接收 输入 。 

例 5.3.9 下 面 的 状态 图 定义 了 一 个 不 完全 指定 的 DFA， 它 接收 (ab) " c。 一 旦 输入 与 要 求 的 模式 
不 同 ， 计 算 就 终止。 

输入 abcc 的 计算 将 被 拒绝 ， 因 为 机 器 在 状态 o 下 不 能 处 理 最 后 的 一 个 
字符 c。 oO 

接收 相同 语言 的 两 个 自动 机 称 为 等 价 的 。 一 个 不 完全 指定 的 DFA 可 以 容易 
的 转换 为 一 个 等 价 的 DFA。 转 换 需 要 一 个 额外 的 非 接收 状态 的 “错误 ”状态 。 
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一 且 不 完全 指定 DFA 达到 一 个 没有 动作 的 格局 ， 则 DFA 将 进入 这 个 错误 状态 。 在 错误 状态 上 ，DFA 
读 取 所 有 的 剩 下 的 串 ， 并 终止 。 

fi 5. 3. 10 aeu RE 
Fo WAS q, 是 一 个 错误 状态 ， 它 保证 了 整个 串 被 处 理 。 

例 5.3.11 对 每 一 个 确定 的 .m， TRE SEAT FARE 
DFA 接收 语言 1a'b' | in| 。 状 态 A, 记录 a 的 个 数 ， 同 时 状态 B, 保证 
了 5b 和 a 的 个 数 相同 。 但 是 它 不 能 扩展 为 接收 1aib'| i20] B DFA, Al 
为 这 需要 无 限 个 状态 。 下 一 章 我 们 将 说 明 语言 |aip'1 i0] 不 能 被 任何 
的 有 限 自动 机 接收 。 








5.4 非 确定 型 有 限 自 动机 口 


现在 我 们 改变 对 机 器 的 定义 以 允许 非 确定 型 的 计算 。 在 一 个 非 确定 型 的 自动 机 中 ， 任 意 一 个 给 定 
的 机 器 格局 下 有 多 条 指令 可 以 被 执行 。 这 个 性 质 对 于 自动 机 看 起 来 可 能 不 是 很 自然 ， 但 是 非 确 定性 通 
常 使 得 设计 语言 接收 器 更 加 的 容易 。 

一 个 非 确定 型 有 限 自 动机 (NFA) 的 转换 同 DFA 的 转换 具有 相同 的 作用 : 根据 当前 状态 和 扫描 
到 的 符号 改变 机 器 状态 。 对 一 个 给 定 的 机 器 格局 ， 转 换 函 数 必须 指定 机 器 可 能 进入 的 所 有 状态 。 只 需 
要 让 一 个 状态 的 集合 作为 转换 函数 的 值 就 可 达到 此 目的 。 采 用 状态 图 的 图 形 表示 可 用 来 说 明 非 确定 型 
计算 的 不 同 之 处 。 任 意 有 限 数目 的 转换 可 以 由 给 定 的 状态 4; 和 符号 a 确定 。 非 确定 型 转换 函数 的 值 在 
下 面相 应 的 图 表 中 给 出 。 


Le) 
G) 


6(9 a)- {q} ó(q,. a)-(4, 4, q,) ó(q,, a)- 0 


由 于 非 确定 型 计算 和 相应 的 确定 型 计算 有 很 大 的 不 同 ， 因 此 我 们 的 介绍 将 从 一 个 非 确定 型 自动 机 
的 例子 开始 ， 这 个 例子 展示 了 两 种 计算 类 型 的 基本 区 别 。 此 外 ， 我 们 将 用 例子 介绍 非 确定 型 计算 的 特 
征 ， 并 给 出 非 确定 型 计算 的 直观 解释 。 

考虑 DFA M, 
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它 接收 语言 (aUb) * abba(aUb)*, Bl{a,b} ER 2-F abba WTA. ORAS qo. 91. 4; Fl gs 记录 
了 处 理子 串 abba 的 过 程 。 机 器 的 状态 如 右 表 所 示 。 当 处 理 了 abba 后 , fEIEACAGS 4 ， 即 读 人 余下 的 


串 并 接收 输入 。 "Er" ji 
当 发 现 当 前 子 串 中 不 含有 要 求 的 形式 时 ， 确 定型 计算 p: REER abba 7777 
在 状态 qo. di. o 和 9 必须 “倒退 ”。 当 机 器 在 状态 qu 时 qı: 最 后 处 理 的 一 个 字符 是 a 
扫描 到 5b， 则 进入 状态 m% ， 因 为 最 后 处 理 的 四 个 字符 是 Q: 最 后 处 理 的 两 个 字符 是 ab 
abbb， 当 前 的 格局 表示 没有 向 前 处 理 查 找 abba 的 过 程 。 125: ;最 后 处 理 的 三 个 字符 是 abb 下 
接收 (aUb) ”appa(aUp) 的 一 个 非 确定 型 的 方法 如 下 面 的 自动 机 所 示 : 
a, b a,b 


Ms: a O b © b^ i (4) a 
在 状态 qo 的 M,, AREE a 时 存在 两 种 可 能 的 转换 : 一 种 是 M, 继续 位 于 状态 go ， 并 读 入 余下 的 串 ; A 
一 种 是 进入 状态 序列 qu. q, 和 4 ， 检 查 接 下 来 的 三 个 符号 是 否 构 成 子 串 abba, 

首先 要 注意 的 是 非 确定 型 自动 机 对 一 个 输入 串 有 多 个 计算 。 例 如 ，M2 对 输入 串 aabbaa 有 5 个 不 
同 的 计算 。 我 们 将 采用 5.2 节 之 中 引入 的 符号 厂 来 跟踪 计算 : 


[ go, aabbaa | [ q), aabbaa | [ qo, aabbaa | [ go, aabbaa | [qo。, aabbaa | 
上 Lq, abbaa] [go, abbaa] t+ [q, abbaa] H [4,, -abbaa] 
qo, bbaa | H [q, bbaa] [gqo, bbaa | H [q,, bbaa] 
E: 
E 


[qy, abbaa | H| 

{= 
[ 4o, baa | F- [a baa | = Lax baa] 
[ fF 

= 


[q), baa] 
[qo, aa] [go, aa] H [45, aa] 
[4s, 4] 上 [qo, a] [q, a] FF lq, a] 
lgo A] - [a; A] F [«, 4] 


当 一 个 串 具 有 几 个 终止 在 接收 状态 的 计算 ， 而 其 他 的 计算 终止 在 拒绝 状态 时 ， 接 收 一 个 串 是 什么 意思 
We? 答案 在 于 使 用 前 面 段落 之 中 提 到 的 词 检查 。NFA 是 设计 来 用 于 检查 一 个 状态 是 否 得 到 了 满足 , 在 
这 个 例子 中 ， 即 输入 串 是 否 含有 子 串 abba。 如 果 其 中 一 个 计算 发 现 子 串 存在 ， 则 条 件 满足 ， 串 被 接 
收 。 与 不 完全 指定 的 DFA 一样 ,为 了 获得 一 个 肯定 的 答案 就 必须 读 完整 个 输入 串 。 概括 起 来 , 如果 
至 少 存 在 NEAI 的 一 个 计算 满足 下 面 的 条 件 ， 则 输入 串 被 NFA 接收 : 

i) 处 理 完 整个 串 ， 并 且 

i) 停止 在 接收 状态 。 

如 果 存 在 一 个 计算 接收 一 个 串 ， 那 么 这 个 串 就 在 非 确定 型 自动 机 的 语言 中 ; 是 否 存在 其 他 的 不 接 
收 该 串 的 计算 与 接收 该 串 无 关 。 

设计 非 确定 型 自动 机 时 ， 通 常 采用 一 种 “猜测 与 检查 ”的 策略 。M2 中 从 状态 go 到 gq 的 转换 做 
了 这 样 的 猜测 ， 即 读 和 人 的 a 是 abbpa 子 串 中 的 第 一 个 c。 猜 测 之 后 ， 计 算 继续 进入 状态 % a 和 gs 来 
检查 猜测 是 否 正 确 。 如 果 猜 测 之 后 的 符号 是 bba， 那 么 串 被 接收 。 

如 果 输 入 串 含有 子 串 abba， 其 中 的 一 个 猜测 使 M, 在 读 到 子 串 的 初始 < 时 进入 状态 gq, ， 那 么 这 个 
计算 将 接收 这 个 串 。 此 外 ，M, 只 有 在 已 经 处 理 到 子 串 abba 时 才 会 进入 状态 go WIE, M, 的 语言 是 
(aUb) "abba(aUb)"。 需 要 注意 的 是 ， 接 收 计算 可 以 是 不 惟一 的 ; 如 M 二 存在 两 个 不 同 的 计算 接 
收 串 abbabba。 

如 果 这 是 你 第 一 次 遇 到 非 确定 型 ， 那 可 能 会 问 : 执行 这 种 计算 的 自动 机 的 能 力 如何 呢 ?DFA 可 以 
在 软件 和 硬件 中 很 容易 地 实现 ， 类 似 的 NFA 的 实现 怎么 样 呢 ? 我 们 可 以 直观 的 把 非 确定 型 计算 想象 
为 一 种 多 进程 。 当 计算 进入 一 个 具有 多 个 转换 的 机 器 格局 时 ， 会 为 每 一 种 选择 产生 一 个 新 的 进程 。 根 
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据 这 种 解释 ， 一 个 计算 将 产生 一 棵 进程 树 ， 这 些 进程 并 发 运行 ， 树 的 分 支 由 NFA 的 多 个 选择 产生 。 
计算 aabbaa 产生 的 进程 树 如 下 : 

如 果 其 中 的 一 个 分 支 读 人 了 整个 串 ， 并 且 停止 在 接收 状态 ， 则 接收 输入 ， 整 个 计算 终止 。 只 有 当 所 
有 的 分 支 都 终止 在 非 接 收 状态 时 ， 才 拒绝 接收 
输入 。 

在 前 面 的 例子 之 中 已 经 介绍 了 非 确定 型 计算 的 
性 质 ， 下 面 将 给 出 非 确定 型 自动 机 、 以 及 他 们 的 状 
态 图 和 语言 的 形式 定义 。 除 了 转换 函数 外 ，NFA 
的 各 个 组 成 部 分 和 DFA 的 一 样 。 

定义 5.4.1 一 个 非 确定 型 有 限 自 动机 (NFA) 
是 一 个 五 元 组 M=(Q, 卫 ;6,qu,F)， 其 中 Q 是 状态 
的 有 限 集合 ; 于 是 一 个 有 限 集 ， 称 为 字母 表 ; g,e Q 
是 开始 状态 ; F 是 Q 的 子 集 ， 称 为 终止 状态 集 或 者 
接收 状态 集 ，6 是 从 Q x 工 到 P 的 一 个 全 函 
数 ， 称 为 转换 函数 。 

定义 $.4.2 NFA M 的 语言 记 做 L(M)， 是 M 
接收 的 串 的 集合 。 即 ，L(M) = iw| 存在 计算 
[gow] P [q,,A], 其 中 ，g; Fl 

定义 5.4.3 NFAM - (Q, E,6,q,,F) HRA 
图 是 一 个 带 标记 的 有 向 图 G， 它 满足 下 面 的 条 件 : 

i) G 的 节点 是 Q 中 的 元 素 ; 

i) G PREHRAL PHA; 

iii) qo 是 开始 节点 ; 

iv) FE 是 接收 节点 的 集合 ; 

v) wR qelqa), WEERA q; 到 q; 的 带 标记 a HR, 

DFA 和 NFA 的 关系 可 以 通过 比较 他 们 状态 图 的 性 质 清 楚 地 展现 出 来 。 我 们 可 以 通过 去 掉 定义 
5.3.1 的 条 件 (vi) 获得 定义 5.4.3。 条 件 (vi) 是 将 DFA 转换 函数 的 确定 型 性 质 转换 为 图 形 表示 。 

DFA 和 NFA 的 关系 可 以 用 一 个 看 起 来 有 点 荒废 的 句子 来 概括 :“ 每 一 个 确定 型 有 限 自动 机 都 是 非 
HER” o DFA 的 转换 函数 为 每 一 状态 和 输入 符号 的 组 合 指定 了 惟一 转换 ， 而 NFA 人 允许 0 个 、1 个 或 
者 多 个 转换 。 通 过 将 DFA 转换 函数 解释 为 一 个 从 Q x 妖 到 单元 素 的 状态 集合 的 函数 ，DFA 家 族 可 以 
看 作 是 NFA 家 族 的 子 集 。 

下 面 的 例子 将 展示 NFA 的 各 个 组 成 部 分 的 形式 定义 。 我 们 将 采用 定义 5.4.3 之 中 给 出 的 技术 来 构 
造 相 应 的 状态 图 。 








例 5.4.1 NFA 
M:Q= | 40441592} 9 |a b 
X = {a,b} Go| idol — 14,41 
F={q,} qı, | Ø lal 
q | Ø Ø 


它 的 初始 状态 是 g ， 接 收 的 语言 为 (aUz) * bb。M 的 状态 图 如 下 : 
a,b 
Ga 人 ROLE 
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从 图 中 我 们 很 容易 看 出 ， 一 个 串 当 且 仅 当 它 以 ,如 结尾 时 才能 被 M 接收 。 
正如 前 面 提 到 的 ,一 个 NFA 对 一 个 输入 串 可 以 有 多 个 计算 。 下 面 是 对 串 ababb 的 三 个 计算 : 


Lq, ababb| [ go, ababb | [go, ababb | 
上 [q, babb] 上 [q, babb] H [q, babb] 
k [go, abb] 上 [q,, abb] k [q, abb] 
k [go, bb] H [g bb] 
igor] Hab] 
E [q, À] t[q, A] 


第 二 个 计算 执行 了 三 条 指令 后 终止 ， 因 为 机 器 在 状态 gq 扫描 到 a 时 没有 指定 的 动作 。 第 一 个 计算 处 理 
完整 个 串 ， 并 终止 在 拒绝 状态 ， 而 最 后 一 个 计算 终止 在 接收 状态 。 第 三 个 计算 表明 串 ababb 在 M 的 语 


言 中 。 o 
例 5.4.2 下 面 是 接收 (aUb) ' bb(aUb) 的 有 限 自动 机 M, AM, 的 状态 图 。 
a, b 
-E 
“ J 
M, 是 例 5.3.1 中 的 DFA。 当 遇 到 了 第 一 个 bb FRR, M, 进入 状态 2 并 接收 串 。 而 M, 可 以 根据 处 
理 到 的 任意 一 个 bb 子 串 进入 接收 状态 。 口 a, b 


例 5.4.3 我 们 可 以 把 一 个 接收 含有 bb 子 串 的 机 器 和 一 个 类 
似 的 接收 含有 aa 子 串 的 机 器 组 合 起 来 构造 一 个 NFA， 该 NFA 接 
ikia, b] EIRA aa 或 者 bb FB MSTA A 
一 条 接收 串 的 路 径 是 : 在 状态 qo ERWA, HAAR aa 或 者 bb 
子 串 ， 这 时 ， 路 径 的 分 支 根 据 相应 的 子 串 分 别 进入 gq 或 者 9。 图 
中 存在 三 条 不 同 的 接收 串 abaaabb 的 路 径 。 口 

通过 使 用 非 确定 型 所 获得 的 弹性 ， 并 不 总 是 能 够 简化 利用 M, 
和 M, 来 构造 一 个 接收 LCM, ) UL(M, ) 的 自动 机 的 过 程 。 这 一 点 可 以 从 想 要 构造 一 个 接收 例 5.3.3 的 
DFA 的 语言 的 NFA 看 出 来 。 


5.5 入 -转换 


在 确定 型 和 非 确定 型 自动 机 之 中 ， 从 一 个 状态 到 另 一 个 状态 的 转换 ， 都 是 从 处 理 输入 字符 开始 
的 。 现 在 需要 把 NFA 的 定义 放宽 ， 从 而 允许 不 需要 处 理 任 何 输入 就 进行 状态 转换 。 这 种 形式 的 转换 
称 为 -转换 (A-transition) 。 利 用 入 -转换 的 非 确定 型 自动 机 记 做 NFA- 和 。 

将 -转换 引入 到 有 限 状 态 自 动机 之 中 ， 是 偏离 DFA 确定 性 计算 的 步骤。 然而 ， 它 们 确实 为 设计 
接收 复杂 语言 的 自动 机 提供 了 有 用 的 工具 。 — 

定义 5.5.1 带 入 -转换 的 非 确定 型 有 限 自动 机 是 一 个 五 元 组 M=(Q, 工 ,5,qgo,F)， 其 中 Q、5、q 
fe F fe NFA 中 的 一 样 。 转 换 函 数 是 一 个 从 Qx(ZUiXi) 到 了 (Q) 的 函数 。 

我 们 必须 扩展 计算 终止 的 定义 ， 以 包括 下 面 的 情况 : 计算 在 处 理 完 输 入 串 后 ， 可 能 继续 使 用 几 个 
入 -转换 。 我 们 应 采用 NFA 之 中 使 用 的 接收 准则 : 如 果 存 在 一 个 处 理 完 整 串 并 且 停 止 在 接收 状态 的 计 
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算 ， 那 么 输入 被 接收 。 和 前 面 的 一 样 ; NFA-) 的 语言 记 做 L(M)。NEFA- 和 的 状态 图 可 以 根据 定义 
5.3.3 来 构造 ， 其 中 A- 转换 表示 为 带 有 入 标记 的 弧 。 

不 需要 处 理 输入 符号 就 能 在 状态 之 间 移 动 的 能 力 ， 可 以 用 来 构造 从 简单 到 复杂 的 自动 机 。 自 动机 
M, 和 M, 分 别 接收 语言 (aUb) " bb(aU b) * fl(bUab) “(aUN)。 


a,b b 

po mM 

(4.9) —. (2) M; (o) — — (2) 
b 


可 以 适当 的 组 合 M 和 M, 的 状态 图 来 构造 复杂 的 机 器 。 
$i) 5.5.1 NFA-AM Wiha A L(M,) UL(M,), 





组 合 自动 机 M 的 计算 经 过 一 条 入 MEA M, RE M, 的 开始 状态 。 如 果 存 在 一 条 M, 上 的 接收 串 的 路 
径 p， 那 么 该 串 能 够 被 M 接收 ， 路 径 是 由 从 qo 到 go。 的 A 弧 和 路 径 p 构成 的 。 因 为 在 每 一 个 计算 的 初 
始 移 动 时 都 不 处 理 输 入 字符 ， 所 以 M 的 语言 是 L(M) UL(M,)。 CR 
和 例 5. 3. 3 之 中 的 确定 型 状态 图 进行 比较 。 

例 5.5.2 —^- BE LCM, )L(M,) If] NFA-A, Hl M, 和 M, 接收 的 语言 工 的 连接 ， a 
一 条 入 弧 将 两 个 自动 机 连接 起 来 的 方法 构造 。 


a,b a,b 


一 个 输入 串 被 接收 ， 当 且 仅 当 它 由 一 个 L(M, ) 中 的 串 连接 一 个 上 L(M2z ) 中 的 串 组 成 。 eee Te 
AB SRT M, 接收 ， 则 入 -转换 允许 计算 进入 M2z。 

$15.5.3 我 们 将 使 用 和 A- 转换 来 构造 一 个 NFA-A， 它 接收 任何 1a,b| 上 的 长 度 为 偶数 的 串 。 ih 
从 构造 接收 长 度 为 2 的 串 的 自动 机 的 状态 图 开始 。 


XG) a,b O a, b 


为 了 接收 空 串 ， 需 要 再 加 一 条 从 g Pa 的 入 - 弧 。 任 何 长 度 为 正 偶数 的 串通 过 沿 着 从 9 到 qo 的 入 - 弧 


重复 序列 Qo. Ux 1 而 被 接收 。 
X 


(4) a,b © a,b 


X 


O 
1815.5. 1, 405.5. 2 145] 5. 5. 3 之 中 的 构造 可 以 概括 为 构造 接收 已 知 有 限 状 态 机 接收 的 语言 的 并 、 
连接 和 Kleene 星 闭 包 的 自动 机 。 第 一 步 是 将 机 器 转化 为 等 价 的 NFA- 和 。 
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3|38 5.5.2 i NFA-AM=(Q,>,6,q,F), #H—-+*F tris NFA- M’ =(QU{q',,9,},2,6 
d'ola), ik Ede Fide 
i) 开始 状态 g 的 入 度 是 0。 
ii) 只 有 一 个 接收 状态 gj。 
ii) 接收 状态 q; 的 出 度 是 0。 [167] 
WEBB: M' 的 转换 函数 可 以 在 M 的 转换 函数 上 增加 对 新 状态 % 和 qj 的 入 -转换 获得 : 
6( 45,2) = CA 
5(q,,4) 2 1a,l ， 对 每 个 qieF 
从 WW 到 gq 的 入 -转换 允许 计算 在 不 影响 输入 的 情况 下 ， 对 原始 的 自动 机 M 进行 处 理 。M' 中 接收 一 个 
输入 串 的 计算 和 M 是 一 样 的 ， 只 是 在 M 的 接收 状态 上 增加 一 个 到 M 的 接收 状态 的 入 -转换 。 a 
如 果 一 个 自动 机 满足 引 理 5.5.2 的 条 件 ， 那 么 开始 状态 的 所 有 作用 是 初始 化 计算 ， 并 且 一 旦 进入 
状态 mg， 计 算 就 终止 。 这 样 的 一 个 自动 机 如 下 图 所 示 : 


图 中 展示 了 一 个 具有 三 个 不 同 组 成 部 分 的 机 器 : 初始 状态 、 机 身 和 最 终 状 态 。 这 个 可 以 比 作 一 个 在 两 
端 有 连接 器 的 有 轨 电 车 。 事 实 上 ， 开 始 和 最 终 状 态 的 条 件 是 用 来 允许 它们 扮演 有 限 状态 自动 机 的 连接 
器 的 角色 。 

定理 5.5.3 ik M, M, 是 两 个 NFA- 入 ， 存 在 接收 L(M ) UL(M,),L(M,)L(M, ) fe L(M,)* 的 
NEFA- 和 。 

证 明 : 不 失 一般 性 地 假设 M, M, 满足 引 理 5. 5. 2 的 条 件 。 那 么 ， 构 造 出 来 的 接收 语言 LOM ) U 
L(M,),L(M,)L(M,)7fl L(M,) "的 自动 机 也 满足 引 理 5. 5. 2 的 条 件 。 

由 于 开始 和 最 终 状 态 的 约束 ，M,M2: 可 以 描述 如 下 : 


| 


felici Ti L(M,) ULCM, ) 的 机 器 如 下 : 








计算 开始 ， 首 先 沿 着 \- 弧 进入 Mi 或 M,。 如 果 串 被 其 中 的 一 个 自动 机 接收 ,那么 可 以 经 过 和 - 弧 进 入 
复合 的 自动 机 的 接收 状态 。 可 以 把 这 个 构造 看 作 是 建造 一 个 同时 运行 M 和 M, 的 机 器 。 如 果 任 何 一 
个 机 器 成 功 地 处 理 完 输 入 串 ， 那 么 输入 被 接收 。 

连接 可 以 通过 连续 地 操作 各 个 组 成 自动 机 获得 。 复 合 的 自动 机 的 开始 状态 是 go， 接收 状态 是 
dojo 将 M, 的 终止 状态 连接 到 M, 的 开始 状态 ， 这 两 个 自动 机 就 连接 在 一 起 了 。 j 
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当 一 个 输入 串 的 一 个 前 缀 被 M, 接收 时 ， 计 算 会 继续 进行 并 进入 M,。 如 果 余 下 的 串 被 M, 接收 ， 那 么 
处 理会 终止 在 复合 自动 机 的 接收 状态 q,y。 

一 个 接收 L(M, ) 的 自动 机 必须 能 够 循环 穿 过 M, 若干 次 。 从 状态 91y 进 入 到 状态 go 的 入 - 弧 使 其 
能 够 构成 图 。 为 了 接收 空 串 ， 需 要 另 一 条 从 状态 q PRE 9v 的 入 - 弧 。 这 些 弧 加 到 M, 上 会 产生 : 














在 第 6 章 中 ， 我 们 将 用 到 这 种 形式 的 重复 连接 自动 机 ， 来 确定 一 个 正则 表达 式 所 描述 的 语言 和 有 
限 状态 机 器 接收 的 语言 的 等 价 性 。 


5.6 ”去掉 非 确定 性 


在 前 面 几 节 中 ,我 们 已 经 介绍 了 三 类 有 限 自动 机 ， 每 一 类 都 由 它 之 前 介绍 的 自动 机 产生 。 通 过 放 
宽 对 确定 性 的 约束 ， 我 们 是 否 制造 了 一 种 能 力 更 强 的 机 器 呢 ? 更 准确 地 说 ， 是 否 存在 一 个 能 够 被 NFA 
接收 但 是 不 能 够 被 DPA 接收 的 语言 呢 ? 我 们 将 会 说 明 并 不 存在 这 样 的 例子 。 此 外 ， 还 将 给 出 一 个 
NEFA- 和 转换 为 等 价 的 DFA 的 算法 。 

DFA 和 NFA 中 的 状态 转换 都 伴随 着 对 一 个 输入 符号 的 处 理 。 为 了 将 NFA- 和 中 的 转换 和 对 输入 的 
处 理 联系 起 来 ， 我 们 构造 了 一 个 新 的 转换 函数 +， 叫 做 输入 转换 函数 ， 它 的 值 是 在 给 定 的 状态 下 通过 
处 理 一 个 输入 符号 所 能 够 进入 的 状态 的 集合 。 图 5-3 中 的 转换 tC a) 的 值 为 | g, ,9; ,94; ,ge| 。 状 态 a 
不 在 其 中 ， 因 为 从 q 到 状态 qu 的 转换 不 需要 处 理 任何 的 输入 符号 。 


路 径 处 理 的 字符 串 @—-—@ 
91542 a a (6) : ©) 
9154254 a 
e i 入 @) A 
qi 44,4. a 
ek RUN a (2) 3 (4) A (4%) 


图 5-3 带 入 -转换 的 路 径 


直观 地 ,输入 转换 函数 1( q; ,a) 的 定义 可 以 分 为 三 个 部 分 。 首 先 ， 构造 从 状态 q; 不 需要 处 理 输入 
符号 就 能 够 到 达 的 状态 的 集合 ; 接着 ， 获 得 集合 中 所 有 的 状态 处 理 a 之 后 所 到 达 的 状态 的 集合 ; 最 
后 ， 这 些 状态 经 过 入 - 弧 能 够 到 达 的 状态 的 集合 就 构成 了 L qi,a) 。 

函数 :通过 采用 转换 函数 5 和 状态 图 中 标识 为 空 串 的 路 径 来 进行 定义 的 。 如 果 存 在 一 条 从 q 到 q, 
的 标记 为 空 串 的 路 径 ， 则 称 状态 9 TE q; 的 入 - 闭 包 之 中 。 

定义 5.6.1 状态 di 的 入 - 闭 包 ， 记 做 A-closure(q;) ， 递 归 定 义 如 下 : 

i) 基础 步骤 : q, e d-closure(q;) o 

i) 递归 步骤 : iX q, 是 入 -closure(9gi) 之 中 的 元 素 ， 如 果 gi 68(q,,X) , M q, e A-closure( q;) 

iii) 闭 包 : q,eA-closure(q;) ， 当 且 仅 当 从 q; 能 够 通过 应 用 有 限 步 的 递归 步骤 获得 qj。 

集合 A-closure( gq;) 可 以 根据 算法 4.3.1 中 的 自 顶 向 下 的 方法 获得 。 它 决定 了 在 上 下 文 无 关 的 语法 
中 的 链 。 输 入 转换 函数 可 用 从 状态 的 入- 闭 包 和 NFA-M 的 转换 函数 中 获得 。 
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EM 5.6.2 NFA-A M IA SEXE 1 ZA QX X5] PQ) 的 函数 ， 定 义 如 下 : 
t(q,,a) = t A-closure(8(q,,a) ) , 


q, € k-closure( q;) 


其 中 6 是 M 的 转换 函数 。 [170] 
输入 转换 函数 和 NFA 的 转换 函数 具有 相同 的 形式 。 即 ， 输 入 转换 函数 是 从 Q x X SIR S 4E MN 

函数 。 不 带 入 -转换 的 NFA 的 输入 转换 函数 1 和 自动 机 的 转换 函数 8 相同 。 
例 5.6.1 转换 函数 86 和 NFA-M 的 输入 转换 函数 1 的 转换 表 如 下 所 示 ，M 是 NFA-A 的 状态 图 。 

M 接收 的 语言 是 : a*b*c*。 








6 a b e 入 
qo 149,41,42] Ø Ø o 
4 |Ø lal Ø Ø 
M a |Ø Ø la} lal 
t a b [4 
do | go ,41 +921 Ø Ø 
q |Ø lat Ø 
4 |Ø la} 141421 o 








NEFA- 和 的 输入 转换 函数 可 以 用 来 构建 一 个 等 价 的 DFA。 非 确定 型 自动 机 是 否 接收 输入 ， 取 决 于 
是 否 存在 能 够 处 理 完整 串 并 停止 在 接收 状态 的 计算 。 在 NFA- 和 状态 图 中 ， 可 能 存在 几 条 表示 输入 串 
处 理 的 路 径 ， 而 在 DFA 状态 图 中 只 存在 惟一 的 路 径 。 为 了 去 掉 非 确定 性 ，DFA 必须 模拟 同时 探测 
NEFA- 和 中 所 有 可 能 的 计算 。 | 

算法 5. 6. 3 迭代 地 构造 一 个 与 NFA-、 M 等 价 的 确定 型 自动 机 的 状态 图 。DFA (CEM 的 等 价 确 
定型 自动 机 ， 称 作 DM) 中 的 节点 是 M 中 节点 的 集合 。DM 的 开始 节点 是 M 开始 节点 的 入 闭 包 。 算 
法 的 核心 是 第 2. 1. 1 步 ， 它 产生 确定 型 自动 机 的 节点 。 如 果 X 是 DM 中 的 一 个 节点 ， 那 么 集合 Y 构造 
如 下 : 它 包含 从 集合 X 中 的 任意 状态 通过 处 理 符号 a 能 够 进入 的 所 有 状态 。 此 关系 在 DM 的 状态 图 中 
表示 为 从 X 到 YY 的 一 条 标记 为 a 的 弧 。 通 过 为 字母 表 之 中 的 所 有 的 符号 构造 一 条 从 XX 出 发 的 弧 ， 这 
样 X 也 是 确定 的 了 。 在 2.1.1 步 中 产生 的 新 的 节点 被 加 入 到 集合 Q' 中 ， 处 理会 继续 进行 , 直到 Q' 中 
的 所 有 节点 都 是 确定 的 。 


算法 5.6.3 构造 与 NFA -入 M 等 价 的 DFA DM 
ii A; NFA- M = (Q, ,6,go,F) 
M 的 输入 转换 函数 1 
1. 将 Q' 初 始 化 为 -closure( qq) 
2. repeat 
2.1. 站 存在 节点 XeQ' 并 且 没 有 标记 为 a BIS TS XK, ae X, then 


2.1.1. Yl (9,20) 


2.1.2. if Y eQ', then Æ Q': =Q’U{Y} 
2. 1. 3. 增加 一 条 从 XX BY 的 标记 为 a 的 弧 
else done: = true 
until done 


3. DM 的 接收 状态 的 集合 是 F' = |Xe Q'| 义 包含 一 个 元 素 q € Fl 


使 用 例 5. 6. 1 中 的 NFA- 入 来 演示 等 价 的 DFA 节点 的 构造 。DM 的 开始 节点 是 包含 M 的 开始 节点 
的 一 个 集合 。 从 状态 qs 处 理 一 个 a 的 转换 可 以 停止 在 状态 dor d. 或 9,。 因此， 为 DFA 构造 节点 1 qo， 
q1 ,9,1 ， 并 用 一 条 标记 为 a 的 弧 把 它 连接 到 | go} Eo MD PAI dol Bida a) IRRA, EM 中 
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的 状态 g 有 三 种 可 能 的 方法 处 理 符号 a。 

因为 DM 是 确定 的 ， 所 以 节点 | do l 必须 有 标记 为 b 和 c 的 弧 离 开 。 增 加 从 节点 qo 到 O tid b 
和 < 的 弧 ， 这 表明 在 NFA-A M 在 状态 qo 扫描 到 这 些 字 符 的 时 候 没有 指定 的 动作 。 

节点 1 qo 具有 确定 的 形式 : 对 字母 表 中 的 每 一 个 元 素 存在 ， 惟 一 的 标记 为 这 些 元 素 的 离开 此 节点 
的 弧 。 图 5-4 (a) 展示 构造 的 这 个 阶段 。 这 个 阶段 创造 了 两 个 额外 的 节点 1go,9 0, 和 GB。 这 两 个 节 
点 都 必须 是 确定 的 。 





图 5-4 等 价 确定 型 自动 机 的 构造 


从 节点 {go,g ,4,1 离开 的 弧 停 止 在 这 样 的 一 个 节点 ,该 节点 包含 所 有 的 从 状态 gr q 或 9 经 过 
处 理 输入 符号 能 够 达到 的 状态 。 输 入 转换 函数 1( q;,a) 指 定 了 从 状态 q 经 过 处 理 输入 a 能 够 到 达 的 状 
Bo Aqua | 出 发 的 标记 为 a AIM, 终止 在 由 1( qo,a)、t(q1,a) 和 1(gq,,a) 的 并 组 成 的 集合 。 这 个 
并 的 结果 仍然 是 | go ,9 ,4,1 。 在 这 个 转换 的 状态 图 中 添加 了 一 条 从 | qo,91,9;1| 指向 自身 的 弧 。 

空 集 表示 DM 的 一 个 错误 状态 。 在 状态 Y 读 入 a 进入 空 集 ， 当 且 仅 当 对 a 和 任意 的 q; e YY 不 存在 
转换 。 一 旦 进入 ,计算 将 处 理 剩 下 的 输入 ， 并 拒绝 接收 串 。 这 在 状态 图 中 表示 为 从 Ø 指向 自身 的 标 
记 为 每 一 个 字母 表 中 符号 的 弧 。 

图 5-4 (b) 给 出 了 和 M 等 价 的 完整 的 确定 型 自动 机 。 非 确定 机 对 输入 串 aaa 的 计算 可 以 终止 于 
状态 Gr 1 Fd 终止 在 状态 qı 的 路 径 展示 了 串 的 接收 。DM 中 处 理 aaa 终止 在 状态 |a。 9 4l dios 
个 状态 在 DM 中 是 接收 状态 ， 因 为 它 包 含 M 的 接收 状态 4,0 

构造 确定 型 自动 机 的 状态 图 的 算法 包含 重复 地 增加 弧 ， 从 而 使 得 图 中 的 节点 是 确定 性 的 。 在 构造 
弧 的 时 候 ， 可 能 构造 新 的 节点 并 把 它 加 入 到 状态 图 之 中 。 当 所 有 的 节点 都 是 确定 的 时 候 ， 算 法 终止 。 因 
为 每 个 节点 是 Q 的 一 个 子 集 ， 因 此 最 多 可 以 构造 card( ?了 (Q) ) 个 节点 。 因 为 carda( P(Q)) xcard( X.) € 
迭代 次 数 的 上 限 ， 所 以 算法 5.6.3 总 是 会 终止 的 。 定 理 5. 6.4 将 说 明 M 和 DM 是 等 价 的 。 

定理 5.6.4 设 we DL HHQ, = [Gu due In| 是 M 处 理事 w 完 成 时 进入 的 状态 的 集合 。 那 
么 ， 在 DM 中 处 理 w 会 终止 在 状态 Q,,。 

证 明 : 证 明 将 对 串 w 的 长 度 进行 归纳 a-M -处理 完 室 串 后 终止 在 节点 A-closure (q) 这 个 集合 是 
DM 的 开始 状态 。 

假设 对 于 所 有 的 长 度 为 n 的 串 , 该 性 质 都 成 立 。 设 w sua 是 一 个 长 度 为 n+1 的 串 。 设 Q, = aq， 
Gus sau | Fe M 通过 处 理 输入 串 u 得 到 的 路 径 的 最 终 状 态 。 由 归纳 假设 , DM 处 理 4 终 止 在 Q,。M 处 理 
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ua 的 计算 终止 于 在 Q, 中 处 理 a 能够 进入 的 这 些 状态 上 。 集 合 Q, 可 以 通过 如 下 的 输入 转换 函数 来 定义 : 


Q,- U t( q, ,a). 


因为 Q, 是 DM 在 状态 Q, 下 经 过 处 理 输 入 a 进入 的 状态 , 证 毕 。 国 

非 确定 型 自动 机 接收 一 个 串 ， 这 依赖 于 是 否 存在 一 个 处 理 完 整 串 并 终止 在 接收 状态 的 计算 。 节 点 
Q, 包含 由 M 产生 的 接收 w 的 所 有 路 径 的 终止 状态 。 如 果 w SEM 接收 ， 那 么 Q, 包含 M 的 一 个 接收 状 
态 。 这 个 接收 节点 使 Qu 成 为 了 DM 的 一 个 接收 状态 ， 根 据 前 面 的 定理 ，w 被 DM 接收 。 

另 一 方面 ， 如 果 w 被 DM 接收 ,那么 Q, 包含 M 的 一 个 接收 状态 。Q, 的 构造 保证 了 M 中 存在 一 
个 处 理 完 w 并 且 终 止 在 接收 状态 的 计算 。 这 些 观察 为 推论 5.6.5 提供 了 证 明 。 

推论 5.6.5 有 限 自动 机 M 和 DM 是 等 价 的 。 





例 5.6.2 NFA 
b 
M © : © 
a b 
接收 语言 g*0+ ， 下 表 中 构造 了 一 个 等 价 的 DFA: 
状态 符号 NFA 转换 下 一 个 状态 
lao! a 8(q9,a) = 1905411 140541 
{dot b &(qo,b) =Ø Ø 
laoai} a laoa) 214o,4il 149,41] 
ó(qi ,a) =@ } 
140,41] b (qo, b) =Ø 14.421 
8(q,,5) 214,41] 
141 +921 a 6(q,,4) =Ø [2] 
6€q; ,a) =ø 
14,42 b lq b) = 141,421 14,42! 
ó(q5 ,b) =ø 


因为 M 是 NFA， 所 以 M 的 转换 函数 5 作为 输入 转换 函数 的 、 等 价 的 DFA 的 开始 状态 是 jg}。 最 后 得 
到 的 DFA Jy: 





a,b 


例 5.6.3 正如 在 前 面 的 例子 中 见 到 的 ， 利用 算法 5.6.3 构造 的 
DFA 的 状态 是 原来 的 非 确定 型 自动 机 的 状态 集合 。 如 果 非 确定 型 自动 机 
有 nn 个 状态 ,那么 DFA 可 能 有 2" RAS. NFA 的 转换 表明 ， 状 态 数目 
的 理论 上 界 是 可 以 获得 的 。 

DM 的 开始 状态 是 | go} ， 因 为 M 不 含有 入 -转换 
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例 5.6.4 自动 机 M, AIM, 分 别 接收 语言 a(ba) * Fila’. 


M; M;: 


使 用 入 - 弧 将 一 个 新 状态 连接 到 原始 的 自动 机 的 开始 状态 上 ， 这 样 就 产生 了 一 个 新 的 NFA- 入 M, E 
We a(ba)' Ua' , 





M 的 输入 转换 函数 如 下 所 示 : 





14,44] 









qi UA o 
q Ø fai} 
q3 143} Ø 
使 用 算法 5.6.3 可 以 获得 等 价 的 DFA , 
Gana) 
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算法 5.6.3 完成 了 下 图 中 所 描述 的 各 种 有 限 自动 机 之 间 的 关系 。 


ud 


其 中 ,第 头 表示 包含 关系 ; 每 一 个 DFA 能 够 被 再 次 形式 化 为 NFA DUE NFA-A, JA NFA- f] DFA 的 
双 箭头 表明 存在 一 个 与 NFA-》 等 价 的 确定 型 自动 机 。 


5.7 DFA 的 最 小 化 


前 面 的 小 节 说 明了 DFA, NFA 以 及 NEFA- 和 接收 的 语言 是 一 样 的 。 非 确定 型 和 入 -转换 使 得 设计 自 
动机 接收 复杂 的 语言 较为 容易 。 采 用 算法 5. 6.3 可 以 将 非 确定 型 的 自动 机 转换 为 等 价 的 确定 型 自动 机 。 
然而 得 到 的 DFA 可 能 不 是 接收 语言 的 最 小 的 DEFA。 本 节 将 展示 一 个 化 简 算 法 ， 它 能 够 从 一 个 接收 语言 
L 的 DFA 获得 一 个 接收 该 语言 的 最 小 的 DFA。 为 了 完成 化 简 ， 下 面 先 介绍 DFA 中 等 价 状态 的 记号 。 

定义 5.7.1 i£M-(Q,X,6,q,F) € DFA. w, HH Puc Dd", 89(q,u)eF SARS 
8(q,,u) EF, MA, X qi fe q; 等 价 。 

两 个 等 价 的 状态 称 为 不 可 区 分 的 (indistinguishable) 。 状 态 的 不 可 区 分 性 定义 的 Q 上 的 三 元 关系 
是 一 个 等 价 关 系 ; 即 ， 该 关系 是 自 反 的 、 对 称 的 和 传递 的 。 两 
个 不 等 价 的 状态 称 为 是 可 区 分 的 。 状 态 % 和 gj 是 可 区 分 的 ， 如 
PEP u fifi 8(q;,u) esF 并 且 8(d,z) e F, MH 6(q,,u) e 
F 并 且 8(q,z) eF。 

如 右 图 所 示 的 状态 和 转换 展示 了 等 价 定义 背后 的 动机 。5 

进入 q; Al, 的 不 带 标 记 的 虚线 表明 进入 该 状态 是 无 关 紧 要 
的 ; 等 价 只 依赖 于 状态 上 的 计算 。 状 态 qu. a, 是 等 价 的 ， 因 为 des 





它们 在 任何 以 5 开始 的 输入 串 上 的 计算 都 进入 一 个 接收 状态 ， 
而 任何 以 开始 的 串 的 计算 都 终止 在 一 个 非 接收 状态 。 因 为 状 
AS dy 和 q, 是 等 价 的 ， 所 以 状态 q: 和 9 也 是 等 价 的 。 

转换 背后 的 直觉 告诉 我 们 ， 可 以 合并 等 价 的 状态 。 将 此 应 
用 到 前 面 的 例子 可 得 到 如 下 图 所 示 的 状态 和 转换 。 

通过 合并 来 减少 DFA 的 状态 ， 需 要 设计 一 个 识别 等 价 状态 的 过 程 。 在 完成 这 项 工作 的 算法 中 ， 
每 一 对 状态 q; 和 9(i< 力 具有 一 对 相关 联 的 值 DLi,j] 


和 S[i, 让 。 当 确定 两 个 状态 是 可 区 别 的 时 候 ,D[i,j] 0 » En ) a 
被 设置 为 1。S[ mn] 是 索引 的 集合 。 当 状态 MGD TTY 

区 分 能 够 由 状态 9, 和 q, 的 区 分 得 出 时 ， 索 引 [i 门 在 -7 

集合 SLm,n] 中 。 a A ) a, b 


算法 开始 时 ， 如 果 4 和 9 中 一 个 是 接收 状态 而 另 
一 个 不 是 接收 状态 ， 则 将 每 一 个 状态 对 q, 和 a; 标记 为 可 区 分 的 。 接 下 来 ， 算 法 系统 地 检查 每 一 个 没 
有 标记 的 状态 对 。 当 两 个 状态 标明 是 可 以 区 分 的 时 ， 递归 的 调用 过 程 DT 将 D[ i; RRA I. WA 
DIST(i,j) 不 只 是 标记 q; 和 gq) 是 可 区 分 的 ， 同 时 还 通过 调用 DISTE mn) RERE S[i, 门 中 的 每 一 个 状态 
对 an 和 9 为 可 区 分 的 。 


算法 5.7.2 确定 DFA 的 等 价 状态 
输入 : DFA M(Q, X,0,q,,F) 
1. (初始 化 ) 
for 每 一 状态 对 q, fll q,, i<j, do 
Lil. DH gy 
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13 9 fi, je =ø 
end for 
2. for 每 一 对 i, j, i<j, if q, Aq, 中 的 一 个 是 接收 状态 ， 另 一 个 不 是 接收 状态 then $ D[ i,j]: =0 
3. for 每 一 对 i, j, i<j, JH. D[i,j]: =0, do 
3.1. if FÆae X, 8(q,,a) 2q,, 8(q,,a) 2q,, 并 且 D[m,n] 21 R# D[ n,m] =1, then 
DIST( i ,j) 
3.2. else 对 每 一 个 ae X, HiT: 置 6(q,,a) =4, JEH 0(4,,a) =q, 
站 m<n 并 且 [i,j] 关 [m,n] then ¥ [i,j] MAB S[ m,n] 中 ， 
else if m » n 并 且 [i,j] 关 [n,m]，then [i,j] MAB S[n,m] 中 
end for 
DIST(i,j) ; 
begin 
D[i,j]:-*1 
for 所 有 的 [m,n] eS[i,j], DIST(m,n) 
end 





下 图 之 间 的 关系 展示 了 可 区 分 状态 标识 背后 的 动机 : 
Guana 
人 sme 过 
当 在 第 3 步 之 中 检查 9 Ma 的 时 候 ， 如 果 g,, Ag, 已 经 标识 为 可 区 分 ， 那么 D[i,j] 被 设置 为 1 来 表明 状 
态 q, Ma 是 可 区 分 的 。 如 果 当 检查 q; 和 gj 的 时 候 ，g,, Allg, 的 状态 未 知 ， 那 么 之 后 当 决 定 的 g, Aq, 是 
可 以 区 分 的 时 ， 同 样 可 以 确定 9% 和 4 是 可 区 分 的 。 数 组 S 是 用 来 记录 信息 [i,j] eS[n,m]， 这 表明 .q， 
和 q, 的 可 区 分 性 足够 确定 状态 a, 和 q, 是 否 是 可 区 分 的 。 这 些 思想 的 形式 化 见 定理 5.7. 3 的 证 明 。 
定理 5.7.3 状态 q, 和 9i 是 可 区 分 的 ， 当 且 仅 当 在 算法 5.7.2 终止 的 时 候 D[i,j] =1。 

WEAR: 首先 ， 我 们 将 展示 每 一 对 满足 DL ij] 21 的 状态 q 和 9 都 是 可 以 区 分 的 。 如 果 DL ij] TE 
第 2 步 之 中 被 设置 为 1， 那 么 状态 q, 和 gj 可 以 被 空 串 区 分 。 在 算法 已 经 将 9， 和 g, 确定 为 是 可 以 区 分 
的 情况 下 ， 如 果 对 于 某 些 输入 a,， 0(q,a) 24, 和 6( gq,,a) =q, 都 成 立 ， 第 3.1 步 才 标记 4 和 q 是 可 
区 分 的 。 设 “是 能 够 区 分 an 和 gq, WE, ABA au 将 能 够 区 分 状态 q; 和 go 

为 了 完成 证 明 ， 我 们 有 必要 展示 每 一 个 可 区 分 状态 对 是 如 何 被 指派 的 。 证 明 通 过 对 能 够 区 分 可 区 
分 状态 对 的 最 短 串 的 长 度 进行 归纳 。 归 纳 的 基础 包含 所 有 的 能 够 被 长 度 为 0 的 串 区 分 的 状态 对 9 和 
q,. 即 ， 计 算 8(q,,X) =q M3(q,,d) =q EHE qu 和 gq 区 分 开 。 在 这 种 情况 下 ，g, 和 4 中 只 有 一 个 状 
态 是 接收 状态 ，DF[i, 门 在 第 2 步 之 中 被 置 为 1。 

现在 ， 假 设 算法 已 经 标记 出 了 所 有 的 能 够 被 长 度 不 大 于 大 的 串 区 分 开 的 状态 对 。 设 qu Al 的 最 
短 区 分 串 u KEH k+l WA, u 可 以 写成 av, 输入 为 4 的 计算 具有 下 面 的 形式 : 8(q ,zx) 26(q,, 
av) = 8(q,,v) =q, 和 6(g,,u) =Ê (qav) «8(q,,v) =4,。 因 为 前 面 的 计算 已 经 区 分 了 q Ma, 
q, 和 g, 中 只 有 一 个 是 接收 状态 。 很 明显 ， 同 样 的 计算 展示 了 q, 和 g, 被 一 个 长 度 为 上 的 串 区 分 。 根 据 
归纳 ， 我 们 知道 算法 将 置 D[m,n] 为 1。 

如 果 在 第 3 步 检查 状态 9 Ma 之 前 ，D[m, 中 已 经 被 置 为 1， 那 么 会 通过 调用 DIST(i,j) 将 DL i,j] 
置 为 1。 如 果 在 3. 1 步 的 循环 之 中 检查 状态 % 和 gq,， 并 且 此 时 D m,n) 1, PAWEL] WS SUAE 
合 5[m,n] 之 中 。 根 据 归纳 假设 ,DLm,n] 将 最 终 被 置 为 1。 因 为 [i, 门 在 集合 S[m,n] 之 中 ,通过 递归 
调用 DIST(m,n) 将 置 DL ij] 1o a. 

从 原始 的 DFA M = (Q, X 8,4 , F) 和 不 可 区 分 关系 可 以 构造 出 一 个 新 的 DFA M'。M' 的 状态 是 M 
之 中 的 不 可 区 分 状态 构成 的 等 价 类。 初始 状态 是 [q ] ， 终止 状 态 是 [9,] ， 其 中 a; e F。M' 的 转换 函数 
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5 LA 8 ([q,],a) 2 [0'(qi,a) ], 在 练习 44 中 展示 了 良好 定义 的 8"。L(M') 包 括 所 有 的 具有 如 下 计 
算 形式 的 串 : Ôg], u) =[8'(g;, 和 A) ]， 其 中 gq; e F。 它 们 是 正好 被 M 接收 的 串 。 如 果 M' 之 中 具有 从 
[ qo] 通过 计算 不 可 达 的 状态 ， 那 么 会 删除 这 些 状态 和 与 它们 相关 的 所 有 弧 。 

例 5.7.1 下 面 展示 了 DFA M 的 最 小 化 过 程 ，M 接收 的 语言 为 (aUb) (aUb* ) 。 





在 第 2 步 中 , D[O,1],D[0,2],D[0,3].D[ 0,4] ,D[0,5] ,D[0,6] ,D[ 1,7] ,D[ 2,7] ,D[ 3,7]. 
DL4,7] \.DL5,7] 和 DL6,7] 被 置 为 1 。 每 一 个 在 第 2 步 中 没有 标记 的 索引 将 在 第 3 步 中 得 到 检查 。 下 
面 的 表格 展示 了 每 一 个 索引 所 采取 的 动作 : 











索引 动作 原因 
[0,7] D[0,7] =1 被 a 区 分 
[1,2] D[1,2] =1 被 a 区 分 
[1,3] D[1,3] =1 被 a 区 分 
[1,4] S[2,5] = 1[1,4]! 
S[3,6] 2 1[1,4]1 
[1551] D[1,5] = 被 a 区 分 
[1,6] D[1,6] =1 被 a 区 分 
[2,3 D[2,3] = 被 上 区 分 
[2,4] D[2,4] - 被 a 区 分 
[2,5 无 动作 ,因为 6( q2 ,x) =6(gs x) xe X. 
[2,6 D[2,6] =1 被 上 2 区 分 
[3 ,4 D[3,4] =1 BE a 区 分 
[3,5] D[3,5] =1 被 5 区 分 
[3,6] 
[4,5 D[4,5] =1 被 a 区 分 
[4,6] D[4,6] =1 BE a 区 分 
[5,6] D[5,6] =1 BE b 区 分 








在 对 每 一 对 索引 检查 之 后 ， 会 剩 下 [1,4]、` [2,5] 和 [3,6]， 它 们 是 等 价 状态 对 。 合 并 这 些 状态 得 
到 一 个 接收 (aU5) (aU b * ) 的 最 小 状态 的 DFA M'。 : 
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例 5.7. 
Uba(aUb) 
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2 最 小 化 DFA M 展示 了 通过 调用 DIST 递归 的 标识 状态 的 过 程 。M 的 语言 是 a(aUzD) 


* Ubba(aU b) * s 





由 于 接收 状态 和 非 接收 状态 可 区 分 ， 所 以 将 D[0,4] ,D[0,5] ,D[ 0,6],D[ 1,4] ,D[ 1,5]. 
D[1,6]`.D[2,4]、D[2,5]、DL2,6]\D[3,4]、\D[3,5] 和 D[3 ,6] 都 置 为 1。 跟 踪 算 法 将 会 产生 下 


面 的 表格 : 


索引 
[0,1] 





[2,3] 


[4,5] 
[4,6] 
[5,6] 


动作 


$(4,5] 21[0,1] 


511,2] [0,1] 
S[4,6] 21[0,2] 
$[1,3]31[0,2] 
D[0,3] =1 

$[5,6] 21[1,2 





SIRIT 2 TERZI 


D[1,3] =1 
D[0,2] =1 
D[2,3] =1 
D[1,2] =1 
D[0,1] =1 


合并 等 价 状态 a5 qs 和 gq 会 产生 


a,b 


原因 








被 a 区 分 


被 a 区 分 
调用 DIST(1,3) 
被 a 区 分 
调用 DIST(1 ,2) 
调用 DIST(0,1) 





口 


最 小 化 算法 完成 了 构造 最 优 DFA 的 算法 的 序列 。 非 确定 性 和 入 -转换 为 设计 匹配 复杂 模式 或 者 接 
收复 杂 语 言 的 自动 机 提供 了 工具 。 然 后 ,采用 算法 5.6. 3 将 非 限 定 机 转化 为 DFA， 但 这 个 DFA 可 能 


不 是 最 小 的 。 算 法 5.7.2 完成 了 产生 最 小 化 DFA 的 过 程 。 


到 此 ,我 们 已 经 展示 了 化 简 DFA 的 算法 ， 但 是 这 个 算法 并 没有 证 明 得 到 的 就 是 最 小 的 DFA。 在 
6.7 节 之 中 ， 我 们 将 给 出 Myhill-Nerode 定理 ， 它 以 字符 串 等 价 类 的 形式 刻画 了 一 个 有 限 自 动机 接收 的 
语言 。 这 个 特征 将 用 来 证 明 算法 5. 7. 2 产生 的 自动 机 M' 是 接收 LL 的 惟一 的 最 小 状态 DFA, 
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5.8 练习 
1. & M 是 确定 型 有 限 状态 自动 机 ， 它 的 定义 如 下 : 


Q= 14059159} 
X =14,5} 
F-1g;] 





a) 给 出 M 的 状态 图 。 
b) 跟踪 MAh abaa, bbbabb, bababa 和 bbbaa 的 计算 过 程 。 
c) (b) 中 的 哪些 串 能 够 被 M 接收 ? 
d) 给 出 L(M) 的 正则 表达 式 。 
2. 设 M 是 确定 的 有 限 状 态 自动 机 


Q-14,,4,,4:] 
X = {a,b} 
F= {go} 





a) 给 出 M 的 状态 图 。 

b) 跟踪 M 处 理 串 babaab 的 过 程 。 

c) 给 出 L(M) 的 正则 表达 式 。 

d) WR g。 和 9 是 接收 状态 ， 那 么 给 出 M 接收 语言 的 正则 表达 式 。 
3. DFA M 的 状态 图 如 下 : 





a) 构造 M 的 转换 表 。 
b) baba, baab, abab 和 abaaab 中 哪些 能 够 被 M 接收 ? 
c) 给 出 L(M) 的 正则 表达 式 。 
“4. 扩展 转换 函数 定义 (定义 5.2.4) 中 的 递归 步骤 可 以 用 6'( gq,,au) = 8'(8(q,,a) ,u) 替换， 对 所 有 的 
uceX'.aceXflq,eQ. WH: 6 =6'。 
练习 5 到 练习 21， 构 造 一 个 接收 所 描述 的 语言 的 DFA, 
5. la,b,c| 上 的 字符 串 ， 满 足 所 有 的 a 在 b 之 前 ， 所 有 的 b 在 c 之 前 ,也 可 能 没有 a. b 或 c。 
6. {a,b} 上 的 字符 串 的 集合 ， 其 中 子 串 aa 至 少 出 现 两 次 。 
7. {a,b} 上 的 不 以 aaa 开头 的 字符 串 的 集合 。 
8. [a,b] 上 的 不 包含 aaa 子 串 的 字符 串 的 集合 。 
9. 1a,p,cl 上 的 以 < 开头 ， 包 含 2 个 六 并 且 以 cc 结尾 的 字符 串 的 集合 。 
10. [a,b,c] 上 的 字符 串 的 集合 ， 满 足 每 一 个 b 之 后 至 少 有 一 个 c。 
1l. {a,b} 上 的 字符 串 的 集合 ， 满 足 a 的 个 数 能 够 被 3 整除 。 
12. {a,b} 上 的 字符 串 的 集合 ， 满 足 每 一 个 a 直接 在 一 个 b 之 前 或 者 b ZR, WM: baab. aba Ñi bo 
13. {a,b} 上 的 包含 友子 串 的 长 度 为 奇数 的 串 的 集合 。 
14. (a,b) 上 的 字符 串 的 集合 ， 满 足 长 度 是 奇数 或 者 以 aaa 结尾 。 
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23. 


24. 


23. 


26. 





- |a,b,c| 上 的 只 包含 一 个 a 并 且 长 度 是 偶数 的 字符 串 的 集合 。 


a,b) 上 的 字符 串 的 集合 ， 满 足 子 串 aa 出 现 的 次 数 为 奇数 。 注 意 : aaa 中 aa 出 现 了 两 次 。 


. {a,bl 上 的 包含 有 偶数 个 ba 子 串 的 字符 串 的 集合 。 


1,2,3| 上 的 串 的 集合 ， 满 足 构成 串 的 所 有 数字 的 和 能 够 被 6 整除 。 


- |a,b,c| 上 的 字符 串 的 集合 ,满足 a 的 数目 加 上 也 的 数目 再 加 上 c 的 数目 的 两 倍 能 够 被 6 整除 。 


a,b| 上 的 字符 串 的 集合 ， 满 足 长 度 为 4 的 子 串 之 中 至 少 含 有 一 个 5。 注意: 每 一 个 长 度 小 于 4 的 串 在 
该 语言 之 中 。 
a,bl 上 的 字符 串 的 集合 ， 满 足 每 一 个 长 度 为 4 的 子 串 之 中 都 有 且 只 有 一 个 b。 





. 对 于 下 面 的 每 一 个 语言 ， 给 出 接收 这 些 语言 的 DFA 的 状态 图 。 


a) (ab) ' ba 

b) (ab)'(ba)" 

c) aa(aU b) ' bb 

d) ((aa)'bb)" 

e) (ab'a)" 

设 M 是 非 确定 型 有 限 状 态 自动 机 





a) 构造 M 的 转换 表 。 

b) 跟踪 M 中 对 aaabb 的 所 有 计算 过 程 。 
c) aaabb 在 LIM) 之 中 吗 ? 

d) 给 出 L(M) 的 正则 表达 式 。 

设 M 是 非 确定 有 限 自 动机 


a 


TENN ) ) b 
a) 构造 M 的 转换 表 。 


b) 跟踪 M 计算 aabb 的 过 程 。 

c) aabb 在 L(M) 之 中 吗 ? 

d) 给 出 L(M) 的 正则 表达 式 。 

e) 构造 一 个 接收 L(M) 的 DFA。 

f) 如 果 qo 和 9, 是 接收 状态 ， 给 出 M 接收 语言 的 正则 表达 式 。 
对 于 下 面 的 每 一 个 语言 ， 给 出 接收 这 些 语言 的 NFA 的 状态 图 。 
a) (aUabUaab) * 

by) Cab)" Wa" 

c) (abc)*a* 

d) (baUbb) ' U(abUaa) * 

e) (ab*a)* 

给 出 一 个 NFA-A 的 扩展 转换 函数 8 BIEL. Ôl w) EAA 4 开始 ， 并 能 够 完全 处 理 完 串 w 的 
计算 所 能 够 到 达 的 状态 的 集合 。 
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练习 27 到 练习 34， 给 出 接收 给 定语 言 的 NFA 的 状态 图 。 记 住 NFA 可 以 是 确定 的 ,但 是 在 任何 适当 的 


地 方 你 应 该 使 用 非 确定 性 。 


27, 
28. 


*29. 
30. 


at. 
32; 
39: 
34. 
35. 


36. 


37. 


38. 
39. 


[a,b] 上 的 包含 aa RH bb 子 串 的 字符 串 的 集合 。 

[a,b] 上 的 同时 包含 或 者 同时 不 包含 子 串 aa 和 bb 的 字符 串 的 集合 。 

(a,b) 上 的 字符 串 的 集合 ， 满 足 从 第 三 个 到 最 后 一 个 符号 都 是 bo 

la, b) 上 的 字符 串 的 集合 ， 其 中 第 三 个 和 倒数 第 三 个 字符 都 是 6。 例如，aababaa、abbbbbbbb 和 abba 
都 在 该 语言 之 中 。 

(a,b) 上 的 字符 串 的 集合 ， 满 足 每 一 个 a 后面 都 跟着 5b 或 ab。 

(a,b) 上 的 字符 串 的 集合 ， 具 有 一 个 长 度 为 4 的 子 串 ， 该 子 串 从 开始 到 结束 都 是 同一 个 字符 。 

(a,b) 上 的 字符 串 的 集合 ， 满 足 包含 子 串 aaa 和 bbb, 

ia,b,c|} 上 的 字符 串 的 集合 ， 这 些 串 具有 一 个 长 度 为 3 的 子 串 ， 在 该 子 串 之 中 a、b 和 c 都 恰好 出 现 一 
次 。 

构造 一 个 DFA， 该 DFA fil | a,b] 上 的 以 abba 结束 的 串 。 并 给 出 接收 同一 个 语言 的 具有 6 条 弧 的 NFA 
状态 图 。 

it M Æ NFA- 





a) 计算 A-closure(q;) , i20, 1, 2. 

b) 给 出 M 的 输入 转换 函数 to 

c) 利用 算法 5.6.3 构造 一 个 与 M 等 价 的 DFA 状态 图 。 
d) 给 出 L(M) 的 正则 表达 式 。 

it M # NFA-), 





a) 计算 N-closure(gq;), i20, 1, 2, 3, 

b) 给 出 M 的 输入 转换 函数 to 

c) 利用 算法 5.6.3 构造 一 个 与 M 等 价 的 DFA 的 状态 图 。 

d) 给 出 L(M) 的 正则 表达 式 。 

利用 算法 5. 6. 3 构造 一 个 与 例 5.5.3 中 的 NFA 等 价 的 DFA 状态 图 。 
利用 算法 5.6. 3 构造 一 个 与 练习 17 中 的 NFA 等 价 的 DEA 状态 图 。 
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40. 对 下 面 的 每 一 个 NFA， 利 用 算法 5.6.3 构造 一 个 等 价 的 DFA 状态 图 。 


45. 


a) b b 


MONTO 


b 





. 构造 一 个 接收 (ab) * ff) NFA M, 和 一 个 接收 (ba) “的 NFA M:。 利 用 入 -转换 获得 一 个 接收 (ab) " (ba) * 


的 自动 机 M。 给 出 M 的 输入 转换 函数 。 利 用 算法 5. 6. 3 构造 一 个 接收 L(M) 的 DFA 状态 图 。 


. 构造 一 个 接收 (aba) “的 NFA M, 和 一 个 接收 (ba) "的 NFA M: 。 利 用 入 -转换 获得 一 个 接收 (aba) * U 


(ab) "的 自动 机 M。 给 出 M 的 输入 转换 函数 。 利 用 算法 5. 6. 3 构造 一 个 接收 LM) 的 DFA 状态 图 。 


. 设 状态 a; 和 gq) Æ DFA M 的 等 价 状态 (如 定义 5.7.1) ,并且 ÊC u) =g FS (G,,u) =q,， 对 每 一 个 


ue “都 成 立 。 证明: qg。 和 qd, 是 等 价 的 。 


. 说 明 在 合并 等 价 状态 的 过 程 之 中 获得 的 转换 函数 6' 是 良 定义 的 。 即 ， 说 明 如 果 状 态 q; 和 9 是 满足 [q,] = 


[gj] 的 状态 ,那么 6'([gq;] ,a) =6'([ qj] ,a)， 对 每 一 个 ae 爱 都 成 立 。 

对 每 一 个 DFA; 

i) 跟踪 算法 5.7.2 的 动作 ,确定 M 的 等 价 状态 。 并 给 出 算法 中 计算 的 D[i, 门 和 5S[i, 站 的 值 。 
ii) 给 出 状态 的 等 价 类 。 

ii) 给 出 接收 LCM) 的 最 小 状态 DFA 状态 图 。 

a) 
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b) 


c) 





参考 文献 注释 


Mealy [1955] 和 Moore [1956] 研究 了 有 限 状 态 计算 结果 的 另外 一 个 表示 。Mealy 机 之 中 的 转换 
伴随 着 输出 的 产生 。 一 个 双向 自动 机 允许 带头 朝 着 两 个 方向 移动 。 接 收 相同 语言 的 双向 和 单 向 自动 机 
的 证 明 可 以 在 Rabin 和 Scott [1959] 中 找到 ,在 Rabin 和 Scott [1959] 中 介绍 了 非 确定 型 自动 机 。 
Nerode [1958] 中 给 出 了 最 小 化 DFA 状态 数 的 算法 。Hopcroft [1971] 中 的 算法 提高 了 最 小 化 技术 的 
效率 。 ; 

有 限 自 动机 的 理论 和 应 用 在 Minsky [1967]. Salomaa [1973], Denning, Denning 和 Bravel 
[1983] 之 中 得 到 了 巨大 的 发 展 。 


[192] 





第 6 章 正则 语言 的 性 质 


文法 作为 语言 的 产生 器 而 被 引入 ， 有 限 自 动机 作为 语言 的 接收 器 ， 而 正则 表达 式 则 作为 模式 描述 
符 。 本 章 将 介绍 这 三 种 语言 定义 方法 之 间 的 关系 ， 同 时 将 探究 有 限 自 动机 作为 语言 接收 器 的 限制 。 


6. 1 有 限 状 态 机 接收 正则 语言 


本 节 将 介绍 如 何 构造 一 个 接收 正则 语言 的 NFA-A。 正 则 集合 递归 地 从 B、X 和 一 个 单元 素 集合 中 
构造 出 来 ， 这 个 过 程 将 会 应 用 并 、 连 接 和 Kleene 星 操作 (定义 2.3.2) 。 构 造 接受 正则 集合 的 NFA_ 
可 以 通过 下 面 的 几 个 递归 产生 步骤 获得 。 我 们 将 采用 状态 图 而 不 是 集合 来 构造 。 

HERO. A 和 单元 素 集合 1a| 的 自动 机 的 状态 图 如 下 

注意 每 一 个 自动 机 满足 引 理 5. 5. 2 描述 的 约束 ， 即 ， 自 动机 包括 惟一 的 接 
收 状态 ， 并 且 没有 弧 进入 开始 状态 或 者 离开 接收 状态 。 

正如 定理 5. 5. 3 所 指出 的 ， 可 以 利用 入 -转换 来 连接 这 种 形式 的 自动 机 ， 从 
而 产生 新 的 接收 更 加 复杂 的 语言 的 自动 机 。 重 复 地 利用 这 一 技术 ， 相 应 的 机 器 XG) 
操作 将 能 够 模仿 从 基本 元 素 构造 正则 表达 式 。 这 个 过 程 将 通过 下 面 的 例子 予以 


HR] HE X 
例 6.1.1 通过 递归 定义 的 正则 表达 式 的 方法 构造 一 个 接收 (aU b) * ba 的 © © 


NFA -入 。 中 间 机 器 接收 的 语言 标识 在 状态 图 的 上 面 。 


deor? rise icd 
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(a Ub)* ba 





6.2 RERE 


前 一 节 中 的 构造 表明 了 每 一 个 正则 语言 都 可 以 用 一 个 有 限 自 动机 来 重新 组 织 。 下 面 我 们 将 展示 每 
一 个 有 限 自 动机 接收 的 语言 都 是 正则 的 ， 并 为 自动 机 接收 的 语言 构造 一 个 正则 表达 式 。 为 了 完成 这 个 
任务 ， 我 们 需要 扩展 状态 图 的 概念 。 

定义 6.2.1 一 个 表达 式 图 (expression graph) 是 一 个 带 标 记 的 有 向 图 ， 每 条 弧 上 都 标 有 正则 表 
达 式 。 表 达 式 图 和 状态 图 一 样 ， 包 含 一 个 初始 节点 和 一 组 接收 节点 。 

字母 表 为 二 的 有 限 自动 机 的 状态 图 是 表达 式 图 的 一 个 特例 ; 标记 包含 入 和 字母 表 中 的 元 素 。 表 达 
式 图 中 的 路 径 产 生 正 则 表达 式 。 表 达 式 图 的 语言 是 从 开始 节点 到 接收 节点 的 正则 表达 式 的 并 。 例 如 ， 
表达 式 图 


bta 


ba ba bb 
qu E M eA 
(T aUb @ = 
接收 的 语言 分 别 为 : (ab)' . (b'a) ' (aUb) (ba) “和 (ba) ' b' (bbU(a* (ba)*b*))*, 
由 于 图 非常 简单 ， 因 此 前 面 的 例子 接收 的 语言 的 表达 式 是 显然 的 。 人 们 开发 了 一 个 过 程 用 来 将 任 
意 的 表达 式 图 化 简 为 最 多 只 包含 两 个 节点 的 表达 式 图 。 化 简 是 通过 反复 地 从 图 中 删除 节点 ， 同 时 又 保 
证 图 接收 的 语言 不 变 。 
有 限 自动 机 的 状态 图 可 能 含有 任意 数目 的 接收 状态 。 每 一 个 状态 展示 了 接收 串 的 一 个 集合 ， 处 理 
这 些 串 将 会 成 功 地 终止 在 这 个 状态 。 自 动机 的 语言 是 这 些 集合 的 并 。 由 引 理 5. 5. 2， 我 们 可 以 将 任意 
的 有 限 自 动机 转化 为 一 个 等 价 的 具有 单一 接收 状态 的 NFA- 和 。 为 了 简化 从 有 限 自动 机 产生 正则 表达 
式 的 过 程 ， 我 们 假设 自动 机 只 具有 一 个 接收 状态 。 
在 节点 删除 算法 之 中 ， 将 采用 NFA-A 的 状态 的 序号 来 标识 状态 图 中 的 路 径 。 从 状态 q: 到 a; 的 弧 
的 标记 标识 为 wijo 如 果 状 态 9 到 q 没有 弧 ， 那 么 w, =O. 








算法 6.2.2 从 有 限 自动 机 构造 正则 表达 式 
输入 : 有 限 自动 机 的 状态 图 G， 它 只 含有 一 个 接收 状态 。 
设 go 是 开始 状态 ，g, 是 接收 状态 。 
1. repeat 
1.1. 选择 非 qo 和 gq, 的 节点 q; 
1.2. 根据 下 面 的 处 理 过程 从 G 中 删除 节点 q; 
1.2.1. for 每 一 个 不 等 于 i 的 j, k (包括 j=k) do 
i) if w,, O0, w,, OJFH wi; =O, then 添加 一 条 从 节点 q 到 节点 q, 的 标记 
H ww HIM 
ii) if w,,7 0, w,,7 0 JF H. w,,7* 0, then 添加 一 条 从 节点 q; 到 节点 q, 的 标记 


l0 ARR Xx. HMMS 








为 wii( wii) D wi AY. i 
iii) 让 节点 g; 和 4k 之 间 具 有 标记 为 Wi ;W5 LM y Ws HJIR, then 将 这 些 弧 蔡 换 为 一 


条 标记 为 WUw U…Uw, KI 
1.2.2. 删除 节点 4 以 及 G 中 所 有 连接 它 的 弧 。 
until G 中 只 存在 节点 dofi q, 
2. 决定 G 接收 的 表达 式 。 


删除 节点 q; 是 通过 查找 所 有 以 q 作为 中 间 节 点 的 长 度 为 2 R A, di a 来 完成 的 。 添 加 一 条 
从 a; 到 a, 的 弧 ; 但 会 绕 过 节点 q;。 如 果 没 有 q 到 其 自身 的 弧 ， 则 新 的 弧 上 的 标记 即 为 原 路 径 上 的 两 
条 弧 上 标记 的 连接 。 如 果 w, 750, EM q HAG 之 前 ， 可 以 经 历 wi 任意 次 。 因 此 新 弧 的 标记 为 WwW， 


f Wis) h Wi ko 这 些 图 的 转换 如 下 所 示 : 


Wi 


(2)— -@)—™" -@ | (2— A miaa 
Ge ef nga een 


在 算法 的 第 2 步 中 ， 可 能 会 出 现 乞 求 问题 ; 整个 算法 的 目的 是 确定 G 接收 的 表达 式 。 节 点 删除 过 
程 完成 之 后 ， 可 以 很 容易 地 从 结果 图 之 中 获得 正则 表达 式 。 化 简 之 后 的 图 最 多 只 有 两 个 节点 ， 开 始 节 


点 和 接收 节点 。 如 果 他 们 是 同一 个 节点 ， 则 化 简 之 后 的 图 具有 如 下 形式 : 


u 


6 


Bal u^ 。 开 始 状态 和 接收 状态 不 相同 的 图 ， 化 简 之 后 如 下 : 


它 接收 的 表达 式 为 : uu" v(wUxu' v) ' 。 如 果 图 中 具有 标识 为 Ø RIM, 那么 可 以 简化 表达 式 。 

算法 6. 2. 2 可 以 用 来 构造 具有 多 个 接收 状态 的 有 限 状 态 自 动机 接收 的 语言 。 对 每 一 个 接收 状态 ， 
可 以 产生 一 个 该 状态 接收 的 串 的 表达 式 。 对 每 一 个 接收 状态 的 正则 表达 式 进 行 简单 的 求 并 就 能 获得 自 
动机 的 语言 。 

例 6.2.1 利用 算法 6.2.2 的 化 简 方 法 ， 产 生 NFA 接收 的 语言 的 正则 表达 式 ，NFA 的 状态 图 


如 下 : 
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删除 节点 q 得 到 : 





删除 节点 a, 产生 了 从 g 到 qo 的 第 二 条 路 径 ， 它 标识 为 从 qg 到 go 的 弧 上 的 表达 式 。 删 除 qg, 产生 : 


abb*a 





im bUbb 
C 
它 相 应 的 语言 是 (app * a) * (bUbb) (a(abb* a) ' (DUbb))" , 口 


前 面 两 节 的 结果 产生 的 正则 语言 的 特征 最 初 由 Kleene 提出 。6. 1 节 之 中 提出 的 构造 方法 可 以 用 来 
构造 接收 任何 正则 语言 的 NFEA- 入 。 相 反 ， 算 法 6. 2.2 产生 有 限 自动 机 接收 的 语言 的 正则 表达 式 。 利 用 
确定 型 自动 机 和 非 确 定型 自动 机 的 等 价 性 ，Kleene 的 定理 可 以 用 确定 型 有 限 自动 机 接收 的 语言 的 形式 
进行 表达 。 

定理 6.2.3 (Kleene) iS LAF FAI EH DFA 接收 ， 当 上 且 仅 当 , 工 是 并 上 的 正则 表达 式 。 
6.3 正则 文法 和 有 限 自 动机 


上 下 文 无 关 文法 称 为 正则 文法 ， 如 果 每 一 个 产生 式 具 有 下 面 的 形式 : AaB, A>a, 或 者 AA. 
在 正则 文法 之 中 ， 可 推导 的 串 最 多 包含 一 个 变量 ， 如 果 存 在 的 ， 则 它 是 最 右 端 的 符号 。 一 个 推导 通过 
引用 规则 A—a 或 者 A 一 入 结束 。 

WHA a'b’ 由 文法 G 产 生 ， 它 被 NFA M 接收 ，M 的 状态 为 S、4 和 Z 


G: S—aS| aA a b 


A—bA | b To TEO ENG 


下 面 给 出 了 M 接收 aabb 的 计算 ， 同 时 也 给 出 了 文法 G 中 产生 该 串 的 推导 过 程 。 





推导 计算 处 理 的 字符 串 
$—aS [S, aabb] |} [S, abb] a 
—aaA | [A, bb] sa 
—aabA |= [A, b] aab 
—aabb H} [z, X] aabb 


自动 机 的 计算 以 输入 串 开 始 ， 然 后 连续 地 处 理 最 左边 的 符号 ， 当 整个 串 处 理 完 时 则 停止 。 另 一 方 
面 ， 推 导 从 文法 的 开始 符号 开始 ， 并 将 终结 符号 加 到 推导 的 句子 中 作为 前 缀 。 通 过 应 用 空 规则 或 者 右 
边 只 有 一 个 终结 符 的 规则 终止 推导 。 

上 面 的 例子 说 明了 正则 文法 产生 终结 字符 串 和 自动 机 的 计算 处 理 串 的 过 程 的 对 应 关系 。 自 动机 的 


状态 和 推导 串 中 的 变量 是 一 样 的 。 当 整个 串 处 理 完 毕 时 ， 计 算 终止 ; 同时 ,结果 由 终结 状态 指出 。 它 - 


不 与 文法 之 中 的 任何 变量 相对 应 的 接收 状态 Z 会 被 添加 到 M. 中 ， 用 于 表示 G 的 推导 完成 。 
NFA M 的 状态 图 可 以 直接 从 正则 文法 的 规则 中 构造 出 来 。 自 动机 的 状态 包括 文法 中 的 变量 或 者 
可 能 还 有 一 个 额外 的 接收 状态 。 在 前 面 的 例子 中 ，M 中 的 转换 CS, a) 25.6($,a) =A MCA, b) =A 
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分 别 同 G 中 的 规则 S—aS. S—aA 和 A—bA 相对 应 。 规 则 的 左边 表示 了 自动 机 当前 的 状态 ， 右 边 的 终 
结 符 是 输入 符号 。 与 右边 变量 相对 应 的 状态 是 作为 转换 结果 而 进入 的 状态 。 

因为 终止 一 个 推导 的 规则 并 不 添加 新 的 变量 到 串 中 ， 所 以 应 用 入 规则 和 Aa 规则 的 结果 必须 结 
合 到 相应 的 自动 机 的 构造 之 中 。 

定理 6.3.1 iE G- (V, X,P,S) RENI X:ik, 定义 NFA M - (Q, X,8,8,F)He T; 

i) Q= be {Z|} 其 中 ZgV， 如 果 P 包含 规则 Aa 

V 其 他 
ii) 8(A,a) =B R$% A—>aBeP 

5(A,a) =Z 只 要 4 一 aeEP 
ii) p= [U^ AA eP UIZ}, 4X ZeQ, 
[A| A—A eP] , Hts 
那么 L(M) =L(G) 

证 明 : 来 自 文法 的 规则 构造 自动 机 的 转换 允许 在 M 的 计算 中 跟踪 G 的 推导 。 终 结 符 串 的 推导 具 
有 下 面 的 形式 : Sor, SSwCowa R SSwCow, HHF S SwC 包含 了 形式 为 A>aB 的 规则 的 应 
用 。 可 以 用 归纳 来 证 明 M 之 中 存在 这 样 的 计算 ， 它 处 理 串 w 并 终止 在 状态 C， 只 要 G 中 具有 形式 为 
we 的 句子 (练习 6)。 

首先 ,我们 将 证 明 G 产生 的 每 一 个 串 都 能 被 M Bell, t L(G) BS zs, 那么 5 是 M 的 一 个 
接收 状态 , 并且 NeL(M)。 通 过 应 用 规则 Coa 或 者 Cor 终止 空 串 的 推导 。 在 形式 为 S SwCowa 
的 推导 之 中 ， 最 后 应 用 的 规则 对 应 于 6( C,a) =Z， 它 会 使 自动 机 终止 在 接收 状态 Zo ÉRY S Swe 
wa 的 推导 ， 通 过 应 用 入 规则 来 终止 。 因 为 C- 六 是 G 中 的 规则 ， 所 以 状态 C 是 M 的 接收 状态 。 在 M 
中 wm 的 接收 对 应 于 推导 8 之 wC。 

另 一 方面 ， 我 们 必须 证 明 L(M) CL(G), iw ua 是 被 M 接收 的 串 ， 接收 w 的 计算 具有 如 下 的 
形式 : 

[Sw] -[B,A], KR BZ, 
或 者 
[Sw Ss A La ule AZ Xie 

在 前 一 种 情况 下 ,8 是 G 的 一 个 入 规则 的 左边 变量 。 串 wB 可 以 通过 应 用 与 转换 相对 应 的 规则 推导 出 
Ko w 的 产生 通过 应 用 入 规则 完成 。 类 似 地 ，! 的 推导 可 以 从 与 计算 [S,w] 卢 [4,e] 中 的 转换 相对 应 
的 规则 推导 而 来 ， 通 过 应 用 规则 Ao 终止 推导 而 获得 串 w。 因 此 ，M 接收 的 每 一 个 串 都 在 G 的 语 
言 中 。 a 

例 6.3.1 文法 G 产生 的 和 NEFA M 接收 的 语言 为 & (aUb*), 


G: Sea$| bB| a M: 
B—bB| X 





a 


前 面 的 转换 可 以 反 过 来 从 NFA 构造 正则 文法 。 转 换 5(4,a) =B 产生 规则 4-aB。 因 为 每 一 个 转 
换 会 产生 一 个 新 的 机 器 状态 ， 因 此 不 会 产生 形式 为 Aa 的 规则 。 由 转换 得 到 的 规则 产生 形式 为 5 之 
wC 的 推导 ， 它 是 自动 机 中 的 仿真 计算 。 必 须 添 加 规则 来 结束 推导 。 当 C 是 一 个 接收 状态 时 ,终止 在 
状态 C 的 计算 即 为 w 的 接收 过 程 。 通 过 应 用 规则 C= SESE MESE S SwC, G 中 的 这 个 推导 将 产生 
wo 在 文法 之 中 ,为 自动 机 的 每 一 个 接收 状态 增加 一 个 规则 ， 这 样 文法 便 完成 了 。 定 理 6.3:2 证 明 
这 个 非 形式 化 的 方法 是 正确 的 。 形 式 化 的 证 明 将 留 做 练习 。 口 
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定理 6.3.2. NFAM - (Q, X.,0,4,,F) , ZXEM LH G=(V,L,P,q) 4 TF: 
i) V=Q, 
ii) qaq; e P A 0(q,,a) -4j, 
ii) g,—X e P 如 果 q, EF, 
4 L(G) =L(M). 
定理 6.3. 1 和 定理 6.3. 2 简 述 了 构造 过 程 ， 依 次 地 应 用 这 两 个 定理 可 以 将 一 个 自动 机 转化 为 文法 ， 
然后 再 转换 回来 。 从 一 个 NFA M 开始 ， 转 换 序列 具有 下 面 的 形式 : 
M +G 一 一 > M*. 


因为 G 只 包含 形式 为 4-*aB 或 4 一 A 的 规则 ， 因 此 NFA M' 和 M 是 一 样 的 。 
正则 文法 可 以 转化 为 一 个 NFA， 依 次 地 ， 可 以 再 被 转化 为 文法 G' 
G M Gi, 


通过 增加 一 个 简单 得 变量 CERTE Z) 和 规则 Z- 到 文法 之 中 ,这些 转换 得 到 的 文法 Gn 可 以 直接 从 G 
中 获得 。 所 有 形式 为 A—a 的 规则 可 以 用 A—aZ 替换 。 
例 6.3.2 接收 L(M) 的 正则 文法 G' 可 以 从 例 6.3.1 的 自动 机 M 构造 而 得 ， 
G': S—aS| bB | aZ 
B—bB | X 
Z—k 
转换 提供 了 5 规则 和 第 一 个 B 规 则 。 因 为 B 和 Z 是 接收 状态 ， 所 以 规则 会 被 加 到 文法 中 。 口 
两 个 转换 使 得 我 们 能 够 得 出 结论 ; 正则 文法 产生 的 语言 正好 能 够 被 有 限 自动 机 接收 。 紧 接 定理 
6.2.3 和 定理 6.3.1 (由 正则 文法 产生 的 语言 ) 的 是 正则 集 。 从 正则 文法 到 自动 机 的 转换 保证 了 每 一 
个 正则 集合 能 够 由 某 个 正则 文法 产生 。 这 就 得 到 了 3. 3 节 中 提出 的 正则 语言 的 特征 : 它 是 正则 文法 产 
生 的 语言 。 
例 6.3.3 例 3.2.12 中 的 正则 文法 的 语言 为 ，| a,p,c+ 上 的 不 包含 abe 子 串 的 字符 串 的 集合 。 利 
用 定理 6. 3. 1 构造 一 个 接收 该 语言 的 NFA 
S—bS | c$| aB| X 
BaB | cS| bC| X 
C—aB | bS| X 














口 


例 6.3.4 从 例 5.3.5 中 的 DFA 可 以 构造 一 个 字母 表 为 1a,b| 的 正则 文法 ， 该 文法 产生 含有 偶数 
个 a 和 奇数 个 5 的 字符 串 。 下 面 重新 产生 这 个 自动 机 ， 其 中 状态 [ e。,es]、[o。,es]、[ea,0s] 和 [0,,05] 
分 别 重 命名 为 S、A、B 和 CC。 





相应 的 文法 为 : 


S—4aA | bB 

A—aS | bC 

B—bS| aC| X 

C—aB | bA. 图 
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6.4 正则 语言 的 封闭 性 质 


我 们 已 经 给 出 了 正则 语言 的 定义 ,并且 知 道 如 何 产生 和 接收 正则 语言 。 字 母 表 上 的 语言 是 正则 
的 ， 如 果 它 是 : 

i) 了 上 的 一 个 正则 集合 ; 

i) 能 够 被 一 个 DFA、NFA 或 者 NFA -入 接收 ; 

iii) 由 一 个 正则 文法 产生 。 


一 个 语言 族 在 某 个 操作 下 是 封闭 的 ， 如 果 应 用 该 操作 到 该 族 的 成 员 上 时 产生 该 族 的 另 一 个 成 员 。 每 一 


个 正则 的 等 价 规则 将 用 来 展示 正则 语言 族 的 封闭 性 质 。 

正则 集合 的 递归 定义 确立 了 正则 集合 对 一 元 Kleene 星 和 二 元 操作 并 和 连接 的 封闭 性 。 这 已 经 在 定 
理 5.5.3 之 中 用 有 限 状态 自动 机 的 接收 进行 了 证 明 。 

定理 6.4.1 设 Ll 和 12 是 两 个 正则 语言 。 则 ,语言 Li1UL,、Li 阁 L, 和 L' 都 是 正则 语言 。 

正则 语言 对 补 运算 是 封闭 的 。 如 果 L 是 上 的 正则 语言 ， JSAL-X'-L, 该 集合 包含 了 “中 所 
有 不 在 工 中 的 串 。 定 理 5.3.3 利用 了 DFA 的 这 个 性 质 从 一 个 接收 工 的 自动 机 构造 了 一 个 接收 LL 的 自动 
机 。 补 和 并 相 结合 可 以 推出 正则 语言 对 交 是 封闭 的 。 

定理 6.4.2 设 L 是 有 上 的 正则 语言 那么 语言 L 也 是 正则 的 。 

定理 6.4.3 ZL FL, ZL EM EMBS, MABSL OL, 也 是 正则 语言 。 

证 明 : 由 德 摩根 定律 : 

L,nL, = 位 UL ， 
等 式 的 右边 是 正则 的 ， 因 为 它 是 从 L, M L, 通过 补 和 并 运算 获得 的 。 B 
封闭 性 为 我 们 确定 语言 的 规律 提供 了 又 一 个 工具 。 补 和 交 操 作 ， 以 及 并 ,连接 和 Kleene ERE, 
使 我 们 组 合 正则 语言 的 时 候 能 够 保持 正则 性 。 

例 6.4.1 设 L 是 |a,bl} 上 的 语言 ， 它 包含 所 有 含有 子 串 aa 但 不 含 子 串 bb 的 字符 串 。 正 则 语言 
L, - (aUb) ' aa(aUb) ' AIL, = (aUb) ' bb(aU b) 分 别 是 含有 子 串 aa 和 子 串 bb RA, KEL =L, 
NL, 是 正则 的 。 口 

例 6.4.2 设 L 是 ia,b} 上 任意 的 正则 语言 。 语 言 

L, = {u| uelL 并 且 w 恰 好 含有 一 个 al 
是 正则 的 。 正 则 表达 式 b' ab” 描述 了 正好 包含 一 个 a 的 字符 串 的 集合 。 因 为 正则 语言 的 交 是 封闭 的 ， 
所 以 语言 L, -Lnb' ap 也 是 正则 的 。 口 

下 面 的 例子 将 展示 正则 语言 族 的 鲁 棒 性 。 添 加 或 者 删除 一 个 小 的 数目 ， 事 实 上 可 以 是 任意 有 限 个 
数目 的 串 ， 不 会 将 一 个 正则 语言 转化 为 一 个 非 正 则 的 语言 。 

例 6.4.3 iL, 是 了 上 的 正则 语言 , KWL COL’ 是 任意 的 串 的 有 限 集合 。 那 么 UL, ML, -L, 
都 是 正则 的 。 根 据 观 察 ， 这 里 的 关键 是 证 明 任何 有 限 语言 都 是 正则 的 。 为 什么 ? L UL, AL, -L, 的 
正则 性 可 以 由 正则 语言 在 并 和 和 集合 差 (练习 8) 上 的 封闭 性 得 到 。 口 

例 6.4.4 集合 SUF(L) = jy| meLi 包 含 语言 荆 所 有 串 的 所 有 后 缀 。 例 如 ， 如 果 aabbeL， 那么 - 
à, b, bb, abb Fil aabb 都 在 SUF(L) 之 中 。 下 面 将 证 明 ， 如 果 世 是 正则 的 ,那么 SUF(L) 也 是 正则 的 。 
因为 工 是 正则 的 ， 所 以 存在 一 个 定义 工 的 正则 表达 式 ， 它 能 够 被 一 个 有 限 状 态 自 动机 接收 ， 并 且 由 一 
个 正则 文法 产生 。 我 们 可 以 采用 任何 一 类 正则 性 来 显示 SUF(L) 也 是 正则 的 。 | 

采用 文法 分 类 ， 我 们 知道 工 由 一 个 正则 文法 G 2 (V, X,P,8) "^E, 假设 G 中 没有 无 用 符号 。 如 
果 含 有 ， 可 以 采用 算法 4. 4 将 无 用 符号 删除 ， 同 时 文法 保持 其 正则 性 不 变 。 

G P v 的 后 级 由 下 面 的 推导 形式 产生 : 

S SuA =>uv. 
直觉 地 ， 添 加 规则 SA 到 G 中 将 直接 产生 后 绥 
SSA >v. 


不 幸 地 是 ， 结 果 文 法 将 不 再 是 正则 的 。 为 了 解决 这 个 问题 ， 我 们 将 采用 第 4 章 的 文法 转换 。 
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我 们 重新 定义 新 的 文法 G' =(V',d',P’,S’), EP 
V'2NUIS'| 
P'sPUÍS'SA| AeV]. 
G' 中 的 推导 只 使 用 一 个 不 在 G 中 的 规则 。 任 何 工 中 的 串 都 能 够 通过 下 面 的 形式 产生 : 
$'2$ >w, 
同时 ,余下 的 后 级 串通 过 下 面 的 产生 式 产生 : 
$'2A Sw. 


因此 , L(G') =SUF(L)。 删 除 G' 中 的 和 规则 和 链 规则 可 以 获得 一 个 等 价 的 正则 文法 。 口 
6.5 非 正则 语言 
非 完整 定义 的 DFA 如 下 ， 





它 接收 的 语言 为 |a'b'| in| s RASA, 记录 输入 串 中 前 导 a 的 个 数 。 一 旦 处 理 到 第 一 个 bp， 则 自动 机 进 
人 标记 为 B, 的 状态 。 当 处 理 到 相同 数目 的 5b 时， 进入 接收 状态 B。。 可 以 扩展 这 个 策略 来 接收 语言 L = 
[ab | i=0} ， 因 为 它 需 要 无 限 多 个 状态 。 然 而 ， 这 里 可 能 具有 其 他 的 只 要 求 有 限 个 状态 的 自动 机 接收 
Lo 我 们 将 说 明 ， 此 处 是 例外 的 , L 不 能 被 任何 DFA 接收 ， 因 此 它 不 是 一 个 正则 语言 。 

采用 反 证 法 来 证 明 语言 L= |a'b'| i20] 不 是 正则 的 。 假 设 存在 接收 LL MI DEA, 下面 将 推导 出 它 必 
然 具 有 与 4 ，A4,… 相 同形 式 的 用 于 记录 a 的 个 数 的 状态 。 这 导致 了 自动 机 必须 具有 无 限 多 个 状态 ， 这 
与 假设 DFA 只 有 有 限 个 状态 矛盾 。 因 此 我 们 能 够 得 出 结论 ,不 存在 接收 工 的 DFA, 

我 们 开始 假设 工 能 够 被 某 个 DFA 接收 ， 并 称 其 为 Ma 我 们 将 采用 扩展 转换 函数 8 来 展示 自动 机 
M 必须 具有 无 限 多 个 状态 。 设 A, 是 机 器 处 理 串 d 进入 的 状态 ， 即 ÊC, a) =A o HAH i, j20 B. 
ij, 都 有 ab eL Hdb #L。 因 为 前 者 是 接收 状态 ,后 者 是 拒绝 状态 ， 所 以 ÊC ab) 48 (aq, 
db), IIE: 

8(q, ab) 28(8(4,,a) ,b') =8(A,,b') EL 
和 

8(q, db) 28(8(q,,a) ,b') =8(A,,b') eL. 
Eb, CA, B) (A, b) 。 在 确定 型 自动 机 之 中 ， 处 于 相同 状态 的 两 个 计算 ， 处 理 完 同一 个 囊 之 后 
必须 终止 在 同一 个 状态 。 因 为 计算 8(4,,5') 和 6(4;,5') 处 理 同样 的 串 ， 并 终止 于 不 同 的 状态 ， 所 以 我 
们 可 以 得 出 结论 4; 关 Aj。 

我 们 已 经 展示 了 状态 A, MA 对 所 有 的 ij 是 不 相同 的 。 任 何 接收 工 的 确定 型 有 限 状 态 自动 机 都 
必须 含有 无 限 个 对 应 于 A, A, ，4, ，… 的 状态 。 这 与 DFA 具有 有 限 个 状态 的 条 件 矛盾 。 因 此 ， 没 有 
接收 世 的 DEFA， 或 者 等 价 地 ，L 不 是 正则 的 。 前 面 的 讨论 证 明了 定理 6.5.1 的 正确 性 。 

定理 6.5.1 语言 la'b'|i=0| 不 是 正则 的 。 

定理 6. 5. 1 的 证 明 是 一 种 不 存 性 证 明 的 例子 。 我 们 显示 ， 无 论 设计 者 多 么 聪明 ， 都 不 能 构造 接收 
语言 1ab'| i,j20| 的 DFA。 存 在 证 明和 不 存在 证 明 具 有 本 质 的 不 同 。 可 以 通过 构造 接收 语言 的 自动 
机 来 证 明 语言 是 正则 的 。 证 明 不 存在 要 求证 明 没有 接收 该 语言 的 机 器 。 定 理 6.5. 1 可 以 用 来 确定 一 系 
列 的 语言 的 非 正则 性 。 

推论 6.5.2 (为 了 证 明定 理 6.5.1) 设 工 是 史上 的 语言 。 如 果 存 在 一 序列 的 不 同 囊 ue 和 vy， 
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eX',iz0, 使 得 UvieL， uv gL, i 关 j。 那 么 并 不 是 正则 语言 。 

证 明和 定理 6. 5. 1 一样， 将 u 替换 为 a ，v, 替换 为 b'。 

例 6.5.1 {a,bl 上 的 回 文 串 的 集合 上 不 是正 则 的 。 由 推论 6. 5.2， 能 够 找到 两 个 满足 推论 条 件 的 
PSI u,，v;。 这 两 个 串 是 : 


它们 完全 满足 要 求 。 = 
例 6.5.2 文法 是 作为 一 个 定义 语言 语法 的 形式 化 结构 而 引入 的 。 推 论 6. 5. 2 可 以 用 来 显示 规则 


文法 并 不 是 一 个 定义 程序 语言 的 足够 强大 的 工具 ， 如 果 这 个 程序 语言 包含 前 缀 形式 的 算术 和 布尔 表达 


X. 文法 AE 
AE: 4 一 4 
A—T| A+T 
/ Tb | (A) : 
用 + 号 、 括号 和 操作 数 b 生成 加 法 表达 式 。 例 如 (5)、b+(b) 和 ( (b) ) 都 在 L(AE) 中 。 
中 级 记号 允许 在 套 的 括号 ， 这 事实 上 是 要 求 。 推 导 
ST 
=(A) 
=(T) 
=(b) 
展示 了 利用 规则 AE 产生 串 (b) 的 过 程 。 在 应 用 Tb 终止 推 必 之前， 重复 应 用 规则 序列 T4) 
(T) &18588 ((5)) ,(((5))) ,…。 串 (2 和 ) 满足 推论 5.6.2 中 要 求 的 序列 w 和 vw 的 条 件 。 所 以 ， 
文法 AE 定义 的 语言 不 是 正则 的 。 类 似 的 讨论 可 以 用 来 展示 编程 语言 如 C、C++ 和 Java 以 及 其 他 的 一 
些 语言 ， 都 不 是 正则 的 。 回 
正如 正则 语言 的 封闭 性 可 以 用 来 确定 正则 性 ， 它 们 也 可 以 用 来 展示 语言 的 非 正则 性 。 
例 6.5.3 语言 L=|ab | i,jz0, FAIA} 不 是 正则 的 。 如 果 工 是 正则 的 ， 根 据 定理 6.4.2 和 
定理 6.4.3, LNa*b" 也 是 正则 的 。 但 LNa*b”= {ab | i>0}, 而 我 们 已 经 知道 了 这 个 语言 不 是 正 
则 的 。 Oo 


6.6 规则 语言 的 泵 引 理 


在 前 面 一 节 中 ， 存 在 的 非 正 则 语言 是 通过 展示 不 能 构造 一 个 接收 该 语言 的 DFA 来 证 明 的 。 在 本 
节 中 ,将 引入 一 个 确定 非 正则 性 的 更 加 通用 的 准则 。 主 要 结果 ， 正 则 表达 式 的 泵 引 理 ， 要 求 正则 语言 
中 的 串 能 够 允许 分 开 来 满足 某 种 重复 的 性 质 。 

泵 作用 一 个 串 是 通过 重复 地 从 原始 的 串 中 抽取 子 串 来 构造 新 
AYER DFA 状态 图 中 的 接收 表示 了 抽取 串 的 过 程 。 考 虑 L(M) 中 
的 串 z = ababbaaab, EMA AMF Bu. v H wI u=a, v= y: 
bab, w = baaab fil z = uvw, t&a( bab)'baaab Fy VA38 xb VE AFB 
ababbaaab 中 的 子 串 bab 而 获得 。 - 

通常 ， 在 DFA M 之 中 处 理 z 相 应 地 会 在 M 的 状态 图 中 产生 一 
条 路 径 。z 分 解 成 u、v 和 w 会 在 状态 图 中 将 路 径 打破 成 为 三 条 子 
Kio TE u =a Fil w = baaab 的 计算 产生 的 子路 径 分 别 为 gg，gq 
Fl di ds, do, do» dio Gro 处理 分 解 的 第 三 个 部 分 产生 环 qi, 

b, h, ao REMER uv'w 同样 能 够 被 DFA 接收 ， 因 为 子 串 v 的 重复 只 是 在 处 理 w 并 终止 在 状 
态 qs 之 前 ， 简 单 地 增加 额外 的 周游 回路 4, ，4g3，4,，4qi1。 
泵 引 理 要 求 对 DFA 的 语言 中 所 有 足够 长 的 串 存 在 这 样 的 一 个 分 解 。 下 面 将 列 出 两 个 引 理 ,它们 





BOF IHEHHA 117 


给 出 了 在 DFA RAR HE PEE In ERAS RE. RPS RTE, XU ae 
盒子 的 数目 ， 以 及 一 个 数量 大 于 盒子 数目 的 需要 分 发 到 这 些 盒子 之 中 的 物品 的 观察 观察 发 现 至 少 有 
一 个 盒子 中 物品 的 数量 大 于 或 等 于 2。 
引 理 6.6.1 设 G 是 具有 k 个 状态 的 DFA 的 状态 图 。G 中 任何 一 条 长 度 为 大 的 路 径 中 必 包 含 一 个 环 。 
证 明 : 长 度 为 大 的 路 径 包 含 上 + 1 个 节点 。 因 为 G 中 只 有 天 个 节点 ， 所 以 必定 有 一 个 节点 在 路 径 之 
中 至 少 出 现 了 两 次 ， 记 为 9;。 从 第 一 次 出 现 的 q 到 第 二 次 出 现 的 4; 的 子路 径 就 是 所 要 求 的 环 5 
长 度 大 于 上 的 路 径 可 以 分 为 一 个 初始 的 长 度 为 k 的 子路 径 和 余下 的 路 径 。 引 理 6. 6. 1 保证 了 在 初 
始 的 子路 径 之 中 具有 一 个 环 。 推 论 6. 6. 2 形式 化 表达 了 前 面 的 叙述 。 
推论 6.6.2 设 G 是 具有 Kk 个 状态 的 DFA 的 状态 图 , p 是 长 度 大 于 等 于 的 路 径 。 路 径 p 可 以 分 
解 为 子路 径 q、r 和 s， 其 中 p=qrs、qr 的 长 度 小 于 或 者 等 于 k， 并 且 了 是 一 个 环 。 
定理 6.6.3 (正则 语言 的 泵 引 理 ) ” 设 L 是 正则 语言 ， 它 被 具有 Kk 个 状态 的 DFA M 接收 。 设 z 是 
L 的 任意 长 度 大 于 等 于 的 囊 。 那 么 ,z 可 以 写成 ww HBX, 其 中 length(uv) <k，length(v)>0 并 
且 对 于 所 有 的 i 二 0 AF w'we L. 
WEBB: 设 zeL, 它 的 长 度 为 n, nzk, TE M 处 理 z 的 时 候 , 将 在 M 的 状态 图 中 产生 一 条 长 度 为 n 
的 路 径 。 根 据 推论 6.6.2， 这 条 路 径 可 以 分 解 为 子路 径 q、r 和 s， 其 中 + 是 状态 图 中 的 一 个 环 。 将 z 分 
ftu. v 和 w， 它 们 分 别 是 路 径 q、r 和 s 上 的 标记 。 
EB uv'w 所 对 应 的 路 径 与 串 uvw 开始 和 终止 节点 相同 。 惟 一 的 不 同 是 环 路 z 出 现 的 次 数 。 因 此 ， 如 
R uvw 能 够 被 M 接收 ， 那 么 uv'w 也 能 够 被 M 接收 。 
在 证 明 泵 引 理 的 过 程 中 ,并 没有 特别 指出 接收 工 的 特定 DFA 的 性 质 。 讨 论 对 于 所 有 的 DFA 都 成 
3L, 包括 只 具有 最 小 数目 状态 的 DFA。 陈 述 定理 的 时 候 可 以 将 加 强 是 接收 工 的 最 小 DFA 的 状态 数 。 
泵 引 理 是 证 明 一 个 语言 不 是 正则 语言 的 强大 的 工具 。 正 则 语言 中 的 每 一 个 长 度 大 于 等 于 大 的 串 ， 
其 中 上 的 值 由 特定 的 泵 引 理 确定 ， 都 必须 具有 一 个 适当 的 分 解 。 为 了 说 明 语言 不 是 正则 的 ， 只 需要 找 
到 一 个 不 满足 泵 引 理 条 件 的 串 即 可 。 使 用 泵 引 理 确认 非 正则 性 将 在 下 面 的 例子 之 中 展示 。 它 包含 选择 
一 个 工 的 串 z， 并 说 明 不 存在 z 的 一 个 分 解 ww， 使 得 对 所 有 的 i=0 都 有 uv we Lu E 
816.61 iL-izelal" | 7eng 纺 (z) 是 平方 数 | 。 假 设 工 是 正则 的 。 这 表明 工 能 够 被 某 个 DFA 
接收 。 设 该 DFA 的 状态 数目 是 X。 由 泵 引 理 ,任何 一 个 长 度 大 于 等 于 的 串 ze 工 都 可 以 分 解 成 子 串 
u、v 和 w， 从 而 使 得 length(uv) <k,v 关 并且 对 所 有 点 i20, uvweL, 
BIRR z=a* 的 长 度 为 忆 。 因 为 z 在 LL 中， 并且 长 度 大 于 k， 因 此 z 可 以 写成 z=wuvw 其 中 u、v 和 
w 满足 泵 引 理 的 条 件 。 特 别 地 ，0 < length(v) <k。 这 点 可 以 用 来 确定 uw KERER 
length( uv ’w) = length(uvw) + length( v) 
=k +length(v) 
<k +k 
«KE +2k+1 
=(k+1)’. 
uv w KER E iivbF(k+1)?, AULA B—P ERR, Alt, $ uw 不 在 工 之 中 。 我 们 已 经 展 
示 了 不 存在 z 的 一 个 满足 泵 引 理 的 分 解 。 这 与 假设 工 是 正则 的 了 矛盾， 因此 工 不 是 正则 的 。 i] 
$016.62. 说 明 语言 L = |a |i 是 质数 | 不 是 正则 的 。 假 设 存在 一 个 具有 上 大 个 状态 的 接收 五 的 DFA。 
设 n 是 大 于 上 的 最 小 的 质数 。 由 泵 引 理 可 得 ，a” 可 以 分 解 成 子 串 uvw, vs A IFA MA i20, w'we 
Lo 假设 存 在 这 样 的 分 解 。 
如 果 iuv"*'weL， 那 么 它 的 长 度 一 定 是 质数 ,但 是 : 
length( uv" * w) = length( uvv"w) 
= length( uvw) + length( v" ) 
=n+n(length(v) ) 
=n(1 +length(v) ). 
因为 长 度 不 是 质数 ， 所 以 uv" * w REL Po 因此 不 能 够 把 a^ 分 解 为 满足 泵 引 理 的 ww, 于 是 可 以 得 
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出 结论 , 工 不 是 正则 的 。 口 
在 前 面 的 例子 中 ， 串 的 长 度 的 约束 对 于 证 明 语 言 不 是 正则 的 是 充分 的 。 通 常 可 以 用 串 元 素 之 间 的 
数值 关系 来 说 明 不 存在 一 个 满足 泵 引 理 的 子 串 。 下 面 将 提出 另 一 个 论据 ， 这 次 我 们 用 泵 引 理 来 说 明 
fa'b'| i20] 不 是 正则 的 。 
例 6.6.3 说 明 L=|a'b'| i=0| 不 是 正则 的 。 我 们 必须 找到 一 个 工 中 的 适当 长 度 的 串 ， 它 不 具有 
满足 泵 引 理 的 子 串 。 假 设 工 是 正则 的 ， 是 泵 引 理 中 指定 的 数 。 设 串 z=a'b",z 的 任意 满足 泵 引 理 的 
分 解 必须 具有 下 面 的 形式 : 
u y Ww 
avi 2 df cs aS 
其 中 i+tj<k 且 j>0。 泵 出 来 任何 下 面 形式 的 子 串 ww=aiaiaa'* h =a'da’, RHEL 中 。 由 于 z 没 
有 满足 泵 引 理 的 分 解 ， 所 有 工 不 是 正则 的 。 O 
6.6.4 HA L= {a'b"c"|0<i,0<m<n} ARIE. (AE L 能 够 被 大 个 状态 的 DPA 接收 。 
那么 ， 由 泵 引 理 ,每 一 个 L 中 长 度 大 于 等 于 大 的 串 z 都 可 以 写成 zx = ww, KP length(w) <k, 
length(v) »0, 并且 对 所 有 的 i=0 有 uv'weL, 
考虑 串 z= ac ， 它 属于 工 。 我 们 必须 说 明 不 存在 z 的 满足 泵 引 理 的 适当 分 解 。z 的 任何 分 解 都 
只 可 能 具有 两 种 形式 之 一 ， 分 情况 进行 讨论 : 
情况 1: 一 个 agv 的 分 解 具 有 下 面 的 形式 : 
u v w 
ab! p pe strict} 
Hpi+j<k-1 A j>0, SÁEH v, PA uv w 2 abb b iid zab'bc** , CREL (m, 
情况 2: 一 个 aev 的 分 解 具有 下 面 的 形式 ; 
u v w 
1 X ab! pee 
HPi<k-1, Rv EK, (Sl w- bc, EREL H, AWE as 
由 上 面 的 分 析 可 知 ，ab*e**' 不 具有 一 个 可 泵 作用 的 子 串 ， 所 以 工 不 是 正则 的 。 回 
泵 引 理 可 以 用 来 确定 一 个 DFA 接收 的 语言 的 大 小 。 泵 作用 在 一 个 串 上 ,将 产生 一 个 无 限 序列 的 
串 ， 它 们 都 能 够 被 DFA 接收 。 为 了 确定 一 个 正则 语言 是 有 限 的 还 是 无 限 的 ， 只 需要 确定 它 是 否 包含 
一 个 可 泵 的 串 。 
定理 6.6.4 设 M 是 上 个 状态 的 DFA。 
i) L(M) 是 非 空 的 ， 当 且 仅 当 M 接收 一 个 长 度 小 于 上 的 串 。 
ii) L(M) 具 有 无 限 个 元 素 ， 当 且 仅 当 M Hol z, 并 且 k<length(z) «2k, 
WEAR: i) WR M 接收 一 个 长 度 小 于 上 的 串 ,，L(M) 显 然 是 非 空 的 。 
现在 设 M 是 语言 非 空 的 自动 机 ， 并 且 z 是 L(M) 中 的 最 小 的 串 。 假 设 z 的 长 度 大 于 k-1. 由 泵 引 
PR, z 可 以 写成 ww， 其 中 心 wEL。 特 别 地 ，rm'w 2 uw J& L PRED z 的 串 。 这 与 假设 z 是 长 度 最 
AWB AIG. AE, length(z) <k. 
ii) 如 果 M Be z, k<length(z) «2k, 那么 z 可 以 写成 ww， Hu, v 和 w HERI RB A 
件 。 这 表明 对 所 有 i20 有 w'weL, 
假设 L(M) 是 无 限 的。 我 们 必须 说 明 L(M) 中 存在 长 度 在 k 和 2k-1 之 间 的 串 。 因 为 在 有 限 字母 
表 上 只 有 有 限 个 串 的 长 度 小 于 k，L(M) 中 一 定 包含 长 度 大 于 -1 的 串 。 选 择 L(M) 中 长 度 大 于 k-1 
的 最 小 的 串 z。 如 果 k<length(z) <2k， 那 么 结论 成 立 。 假设 length(z) 大 2k， 根 据 泵 引 理 可 知 z = ww, 
其 中 length(v) <k, 并 且 uwzuweL(M)« 因为 uw 是 一 个 长 度 大 于 k-1 的 串 ， 而 其 长 度 却 严格 的 
小 于 z 的 长 度 ， 与 假设 矛盾 。 m 
前 面 的 结果 给 出 了 一 个 确定 DFA 的 语言 的 基数 的 方法 。 如 果 大 是 自动 机 的 状态 数 ，j 是 字母 表 的 
X, ABABA G -1)/G- 1) 个 长 度 小 于 大 的 串 。 由 定理 6. 6.4， 检 查 所 有 的 这 些 串 将 确定 自动 机 的 
语言 是 否 为 空 。 检 查 所 有 长 度 在 上 和 2 -1 之 间 的 串 可 以 确定 语言 是 有 限 的 还 是 无 限 的 。 YR, AE 
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一 个 非常 低 效 的 过 程 。 不 过 ， 它 能 够 有 效 地 得 出 下 面 的 推论 。 

推论 6.6.5 设 M 是 DFA， 存在 一 个 算法 来 确定 L(M) 是 空 的 ， 有 限 的 或 者 无 限 的 。 

结合 正则 语言 的 封闭 性 和 推论 6. 6.5， 得 到 一 个 确定 两 个 DFA 是 否 接收 相同 的 语言 的 方法 。 

推论 6.6.6 it M, fe M, 都 是 DFA。 存 在 一 个 确定 M 和 M, 是 否 等 价 的 算法 。 

证 明 : 设 L AIL, 分 别 是 M 和 M, 接收 的 语言 。 根 据 定理 6.4. 1、 定 理 6. 4. 2 和 定理 6.4.3, 语言 

L=(L,NL,) U(L, AL) 

是 正则 的 。L 是 空 的 ， 当 上 且 仅 当 L AL, 是 一 样 的 。 根 据 推论 6. 6.5， 存 在 一 个 确定 工 是 否 为 空 的 算 
法 ,或 者 等 价 地 ， 确 定 M FIM, 是 否 接收 相同 的 语言 。 n 


6.7 Myhill-Nerode 定理 


Kleene 定理 确定 了 正则 语言 和 有 限 自动 机 之 间 的 关系 。 在 本 节 中 ,正则 性 的 特点 在 于 一 个 语言 的 
串 之 间 存 在 等 价 关系 。 这 个 特征 提供 了 一 个 获得 接收 正则 语言 的 最 小 的 DFA 的 方法 ， 同 时 也 为 算法 
5.7.2 给 出 的 DFA 的 最 小 化 提供 了 证 明 。 

定义 6.7.1 设 L 是 了 上 的 语言 ， 如 果 对 所 有 的 we 了 "， uw 和 vw 要 么 都 在 L P, 要么 都 不 在 L 
中 ， 那 么 囊 u, ve “在 L 中 是 不 可 区 分 的 。 

利用 是 否 属于 工 作为 区 分 不 同 的 串 的 准则 ， 如 果 对 于 某 些 串 w， 它 连接 到 u 和 v 时 将 产生 在 工 中 
具有 不 同 的 成 员 关 系 的 串 ， 那 么 & 和 是 可 区 分 的 。 即 w 区 分 w 和 v 当 且 仅 当 zw 和 vw 一 个 在 L 中 而 
另 一 个 不 在 。 

在 LL 中 的 不 可 区 分 性 定义 了 一 个 "上 的 二 元 关系 二 L; 如 果 wu 和 vv 是 不 可 区 分 的 ， 则 u=Lv。 简 
bb, = 是 自 反 的 、 对 称 的 和 传递 的 。 这 些 观察 为 引 理 6. 7. 2 提供 了 基础 。 

引 理 6.7.2 对 任意 的 语言 L， 关 系 三 | 是 一 个 等 价 关 系 。 

例 6.7.1 设 工 是 正则 语言 ae(CaUD) (bb) ' , E aa 和 ab 是 不 可 区 分 的 ， 因 为 对 于 任意 的 w、aaw 
和 abw 要 么 都 在 L rp, 要么 都 不 在 L 中 。 在 前 一 种 情况 中 ，w 中 包含 偶数 个 bp， 而 后 一 种 情况 中 ，w 
为 任意 其 他 的 串 。b 和 ba 在 工 中 同样 是 不 可 区 分 的 ， 因 为 对 任意 的 w、pw 和 baw 都 不 在 L 中 。a 和 
ab Æ L 中 是 可 区 分 的 ， 因 为 连接 bb 到 a 将 会 产生 abb eL, EH bb 到 ab 则 产生 abbb eL, 

=, 的 等 价 类 是 


代表 元 素 等 价 类 


[A]. 入 
[b] : b(aUa) * Ua(aUb) (bb) * a(aUb) * Ua(aUb) (bb) * ba(aU 
-L 


b)* 
a 





lalis 
[aa] st a(aU b) (bb) * 


[aab] s, l a(aUb)b( bb) * m 


例 6.7.2 设 工 是 语言 la'b'|i=0}。a Wa, Hr izj, TEL 中 是 可 区 分 的 。 连 接 b 1ga ab e 
L, 而 ab' gL。 对 于 每 一 个 a ,i=0, 1,2, =, 是 一 个 不 同 的 等 价 类 。 这 个 例子 说 明了 ， 不 可 区 分 
XA c, 可 能 产生 无 限 个 等 价 类 。 四 

GRRA =. 定义 的 不 可 区 分 性 是 基于 语言 的 所 属 关系 。 我 们 现在 定义 一 个 基于 DFA 计算 的 串 的 
不 可 区 分 性 。 i 

定义 6.7.3 iM - (Q, X,0,q,, F) X Ho L #9 DFA, wR lgu) 26(q9,v), PAu, ve E^ 
对 M 是 不 可 区 分 的 。 

FB uL v 对 M 是 不 可 区 分 的 ， 如 果 M 对 输入 的 计算 和 对 输入 vy 的 计算 终止 在 相同 的 状态 。 简 单 
地 说 ， 就 是 这 种 形式 的 不 可 区 分 性 同样 定义 了 “上 的 等 价 关 系 。M 的 每 个 状态 g 对 于 计算 是 可 达 的 
就 有 相应 的 一 个 等 价 类 : 所 有 计算 终止 在 q 的 串 的 集合 。 所 以 ，DFA M 的 等 价 类 的 数目 最 多 为 状态 
数目 。 自 动机 M 的 不 可 区 分 性 记 做 = 。 
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例 6.7.3 i MEEA a' ba" (ba'ba' ) hj DFA, RAMS b 的 串 的 集合 。 关 系 =w 
定义 的 了 "上 的 等 价 类 为 : 


a a a 状态 相关 等 价 类 
TIN OFT PUT 
b 
O 4 = (4) qı _ a” ba* (ba* ba* ) * 
42 a* ba* ba* (ba* ba* ) * D 


不 可 区 分 关系 可 以 用 来 提供 一 个 正则 性 的 额外 特征 。 这 些 特征 利用 了 不 可 区 分 等 价 关 系 的 右 不 变 
性 (right-invariance)。 一 个 了 “上 的 等 价 关 系 三 是 右 不 变 的 ， 当 wu=v， 对 任意 的 we L’, EEEH 
uwzyw, =, M=m 都 是 右 不 变 的 。 

定理 6.7.4 (Myhill-Nerode) — 下面 的 内 容 是 等 价 的 

i) L 是 上 的 正则 语言 。 ; 

ii) 存在 一 个 羡 "上 的 右 不 变 的 等 价 关 系 ， 它 具有 有 限 个 等 价 类 ， 工 是 等 价 类 的 一 个 子 集 的 并 。 

ii) =, 具有 有 限 个 等 价 类 。 C 

WEBB: (i) 推出 〈ii) 。 因 为 工 是 正则 的 ， 它 能 够 被 DFA M = (Q, E ,8, q, F) 接收 。 我 们 将 说 明 
= WEA (ii). EMRE, =, 的 等 价 类 的 个 数 最 多 和 M 的 状态 数 相等 。 因 此 ，=w 的 等 
价 类 的 个 数 是 有 限 的 。 右 不 变 和 M 计算 的 确定 性 ， 保 证 了 对 任意 的 8(q,z) =C V) RBE $ (aq, 
uw) =8(q,ww)。 

接着 ,需要 证 明 工 是 =w 的 一 些 等 价 类 的 并 。 对 M 的 每 一 个 状态 q ， 存 在 一 个 等 价 类 ， 对 该 类 中 
的 串 计 算 终 止 在 状态 qio LÆ M 的 接收 状态 相对 应 的 等 价 类 的 并 。 

(ii) HEM (iii), R= BBE (i) 的 等 价 关 系 ， 下 面 说 明 每 一 个 = 的 等 价 类 [zx] B=, 的 等 价 
Ku]. WR. 

du. vit vu) -中 的 任意 两 个 串 ， 即 x=v。 根 据 右 不 变性 ， 对 任意 的 we “都 有 uw 三 ww。 所 以 
uw 和 vw 在 同一 个 等 价 类 中 。 因 为 L 是 = 的 一 些 等 价 类 的 并 ， 每 一 个 在 特定 的 等 价 类 之 中 的 串 , EL 
中 具有 相同 的 所 属 关系 。 所 以 ，uw 和 vw 要 么 都 到 LL 中， 要么 都 不 在 LL 中。 从 而 w 和 v 在 =, 的 同一 
个 等 价 类 之 中 。 

因为 对 每 一 个 we E", [u]. Elu], -= 的 等 价 类 至 少 包含 一 个 = 的 等 价 类 。 从 而 推出 
等 价 关 系 三 i 的 等 价 类 的 数目 不 会 比 = 的 等 价 类 数目 多 ， 因 此 是 有 限 的 。 

(iii) 推出 〈ii) 。 为 了 对 此 进行 证 明 ， 当 = 的 等 价 类 数目 是 有 限 的 时 候 , 工 是 正则 语言 ， 我 们 需 
要 构造 一 个 接收 LL 的 DFA M,» M, 的 字母 表 包 含 在 L 的 符号 之 中 ， 并 且 状 态 是 = 的 等 价 类 。 等 价 类 
的 开始 状态 包含 入 。 一 个 等 价 类 是 一 个 接收 状态 ， 如 果 它 包含 weL。 所 有 剩 下 需要 做 的 只 是 定义 转换 
函数 和 说 明 M, 的 语言 是 Lo 

对 每 一 个 ae X, Rie 6([u].,,a) = [ua]_,。 由 定义 ,对 于 输入 字符 4， 从 状态 [4] - 转换 
的 结果 是 等 价 类 [ua] .。 需 要 说 明 的 是 转换 的 定义 与 从 等 价 类 中 选择 哪个 特定 的 元 素 是 不 相关 的 。 

设 u 和 v 是 两 个 在 ==, 下 等 价 的 串 。 对 每 一 个 定义 良好 的 转换 函数 6，[ ua] -必须 和 [va] 是 同 
一 个 等 价 类 ,或 者 等 价 地 ，ua=Lva。 为 了 确定 这 一 点 ,我 们 需要 说 明 对 任意 的 串 xe *，uax Al vax 
要 么 同时 在 LL 中 ， 要么 同时 不 在 LL 中。 根据 =1 的 定义 ,对 任意 的 we D*, uw 和 vw 同时 在 或 者 同时 
不 在 工 中 。 令 w=axz 即 可 得 到 结果 。 

下 面 需要 证 明 L(M,) =L。 对 任意 的 串 wx,8([ 入 ] -,,z) = [u] 0 WR uL P, 计算 8([ 入 ] -,， 
2) 终 止 在 接收 状态 [zj] -, 。 练 习 25 将 证 明 等 价 类 [xj] .的 所 有 元 素 或 者 都 在 LL 中 或 者 都 不 在 L 中 。 所 
VA, 如果 zeEL， 那 么 [z] -不 是 一 个 接收 状态 。 从 而 推出 ,wu 被 M, HAK u eL, 

HER, =. 的 等 价 类 正好 是 = 的 等 价 类 ， 这 种 "上 的 不 可 区 分 关系 由 自动 机 M 产生 。 a 

Gi 6.7.4 fil 5.7.1 中 的 DFA M 接收 语言 (aUb) (aUb" ), XX S 的 八 个 等 价 类 和 它们 相对 
应 的 M 中 的 状态 如 下 所 示 : 
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状态 等 价 类 状态 等 价 类 
do X da b 
qı a qs ba 
42 aa d6 bb* 
93 ab* d; (aa(aUb) Uab* aUba(aUb) Ubb* a) (aUb) * 


如 果 对 于 任意 的 w、uw 和 vw 或 者 都 在 LL 中 或 者 都 不 在 ,那么 等 价 关系 二 i 将 u 和 标记 为 不 可 
区 分 的 。 语 言 (aUb)(aUb" ) 的 =L 等 价 类 如 下 : 








三 L 等 价 类 
EXE. À 
[a], aUb 
[2a] ns aa U ba 
[ab], ab* Ubb* 
[aba] =， (aa(aUb) Uab* aUba(aUb) Ubb* a) (aUb) * 


其 中 ， 括 号 中 的 串 代 表 等 价 类 中 的 一 个 元 素 。 很 容易 看 出 ， 在 同一 个 等 价 类 中 的 串 是 不 可 区 分 的 ， 而 
不 同等 价 类 之 中 的 串 是 可 区 分 的 。 
如 果 我 们 所 记 = w 的 、 等 价 类 中 的 并 且 计 算 时 终止 在 状态 q; 的 串 为 chulg), =. MEn 的 等 价 类 
之 间 的 关系 如 下 : 
[A]., 7 cly (qo) 


[a]., =Cly (4) Ucly (44) 
[aa] ., -cl, (qa) Ucly (45) 
[ab]... -cl, (a) Uche (4) 
[ aba =, =cly (q). 


采用 Myhill-Nerode 定理 概述 的 技术 ,我 们 可 以 从 = WENK PAGS — EK L 的 DFA Mi。 得 
到 的 DFA 如 下 : 





它 和 例 5.7.1 中 的 通过 在 5.7 节 中 提出 的 最 小 化 技术 获得 的 DFA M' 是 一 样 的 。 口 

定理 6.7.5 将 说 明 从 ='， 等 价 类 获得 的 DFA M, 是 接收 工 的 最 小 状态 的 DFA. 

定理 6.7.5 ALENE, = 是 由 荆 定 义 的 不 可 区 分 关系 。 接 收工 的 最 小 状态 的 DFA 是 在 
定理 6.7.4 中 指出 的 根据 三 | 的 等 价 类 定义 的 自动 机 Mo 

证 明 : 设 M=(Q, 了 ,6,go,F) 是 任意 的 接收 LL 的 DFA，=w 是 由 M 产生 的 等 价 关 系 。 根 据 My- 
hill-Nerode EH, =u 的 每 个 等 价 类 是 = 的 一 个 等 价 类 的 子 集 。 因 为 =vw flm, 的 等 价 类 都 分 割 二 ” ， 
所 以 =w 的 等 价 类 个 数 至 少 和 = 的 一 样 多 。 将 前 面 的 观察 和 从 =. 的 等 价 类 构造 M, 结合 起 来 ,我们 
能 得 到 : 
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M 的 状态 数 
= =m 的 等 价 类 数目 
> = 的 等 价 类 的 数目 
= Mi 的 状态 数 。 
RUA, BK L B DFA M 不 可 能 具有 比 Mi 更 少 的 状态 数目 。 我 们 可 以 得 出 结论 ，M, 是 接收 工 的 最 小 
状态 数 的 DFA。 [| 


XE R6. 7. 5 指出 了 M, 是 接收 L 的 最 小 状态 数 的 DFA。 练 习 31 将 会 证 明 所 有 接收 工 的 最 小 状态 的 
DFA 都 和 M, 是 一 样 的 ， 只 是 各 个 状态 的 名 字 可 能 不 一 样 。 

定理 6.7.4 和 定理 6.7. 5 确定 了 存在 惟一 的 接收 工 的 最 小 状态 的 DFA Mi。 最 小 状态 的 自动 机 可 
以 从 关系 = 的 等 价 类 构造 。 不 幸 的 是 ， 到 此 我 们 还 没有 给 出 一 个 获得 等 价 类 的 直接 方法 。 定 理 
6.7.6 说 明了 状态 为 三 的 等 价 类 的 自动 机 就 是 在 5.7 节 之 中 最 小 化 算法 产生 的 自动 机 。 

定理 6.7.6 设 M 是 接 收工 的 DEFA，M' 是 从 M 利用 5.7 节 最 小 化 构造 方法 获得 的 自动 机 。 那 么 
M'zM, 

证 明 : 根据 定理 6.7.5 和 练习 31， 如 果 M' 的 状态 数目 和 = 的 等 价 类 的 个 数 相同 ， 那 么 M' 是 接 
WOOL 的 最 小 状态 数 的 DFA。 其 次 由 定义 6.7.3， 具 有 一 个 等 价 关系 三 w 将 M' 的 每 一 个 状态 和 一 个 串 的 
集合 相关 联 。 与 状态 [ q,] 相 对 应 的 = 的 等 价 类 如 下 

ely ({4:] ={ul (La a =La.]} = U lul 8(4,,u) 24jl , 


gela 


其 中 8788 分 别 是 M' 和 M 的 扩展 转换 函数 。 根 据 Myhill-Nerode S38, cly (4) J& e, 的 一 个 等 价 类 
的 子 集 。 

假设 M' 的 状态 数 多 于 = 的 等 价 类 的 个 数 ， 那么 存在 M' 的 两 个 状态 [ 4] 和 [9 ] ,使 得 clw (gq) 和 
cl, (4,) =, 的 同一 个 等 价 类 的 子 集 。 这 表明 ， 存 在 申 u 和 v， 使 得 8(q,u) =q,，$(gqo,v) =9 并 且 
u= Vs 

因为 [go] 和 [9g] 是 M' 的 可 区 分 状态 ， 所 以 存在 一 个 区 分 这 两 个 状态 串 w B 5( g,,w) 被 接收 而 
6( qj,w) 不 被 接收 ,或 者 相反 。 从 而 得 出 ，wuv 和 ww 在 工 中 具有 不 同 的 所 属 关系 。 这 与 w=,v 表明 
uw 和 vw E L 中 具有 同样 的 所 属 关系 是 矛盾 的 。 因 此 ， 假 设 M' 状 态 数 多 于 = 的 等 价 类 的 个 数 是 错 
误 的 。 m 
在 Myhill-Nerode 定理 中 的 正则 性 特征 给 出 了 另 一 个 判断 非 正 则 表达 式 的 方法 。 如 果 等 价 关系 = 
具有 无 限 个 等 价 类 ， 那 么 语言 L 不 是 正则 的 。 

例 6.7.5 在 例 6.7.2 中, 已 经 展示 的 了 语言 1a'b' | i=0| 具 有 无 限 多 个 ==; 等 价 类 ， 因 此 它 不 是 
正则 的 。 D 

例 6.7.6 利用 Myhill-Nerode 定理 来 说 明 语言 L= (a^ | i=0| 不 是 正则 的 。 为 了 完成 证 明 ， 首 先 
说 明 a na fes XXE, 下 是 可 区 的 ， 无论 何 时 都 有 i<j, ER aga] aa” =a" eL, M aa” 
gL。 后 者 不 在 LL 中 ， 因 为 它 的 长 度 比 2 X, 但 是 又 小 于 2*。 所 以 a 和 不 可 区 分 。 这 些 串 将 产生 
一 个 无 穷 序列 : [a] =,, [a ] &,, [7] =, [a] = e ENRE L 的 不 同 的 等 价 类 。 口 


6.8 练习 


1. 利用 6: 2 节 的 技术 构造 接收 语言 (ab) ba 的 NFA- 和 的 状态 图 ， 并 和 练习 5. 22 (a) 中 构造 的 DFA 进行 
比较 。 

2. 对 练习 5. 40 的 每 个 状态 图 ， 用 算法 6. 2. 2 为 自动 机 接收 的 语言 构造 一 个 正则 表达 式 。 

3. 例 5.3.4 中 的 DFA M 语言 包含 ia,b} 上 的 所 有 含有 偶数 个 a 和 奇数 个 b 的 串 。 利 用 算法 6. 2. 2. 为 L(M) 
构造 一 个 正则 表达 式 。 练 习 2.38 要 求 一 个 非 算法 地 构造 一 个 该 语言 的 正则 表达 式 ， 正 如 你 所 见 到 的 ， 它 
是 一 个 多 么 可 怕 的 任务 。 

4. 设 G 是 文法 

G: SaS| bA| a 
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A—aS | bA | b. 
a) 利用 定理 6.3. 1 构造 一 个 接收 L(G) 的 NFA Ms 
b) 利用 (a) 的 结果 ， 构 造 一 个 接收 L(G) 的 DFA M’, 
c) 从 M 构造 一 个 产生 L(M) 的 正则 文法 。 
d) 从 M' 构 造 一 个 产生 L(M’') 的 正则 文法 。 


e) 给 出 L(G) 的 一 个 正则 表达 式 。 
a 
oT On nm 


a) 从 M 构造 一 个 产生 LCM) 的 正则 文法 。 
b) 给 出 L(M) 的 正则 表达 式 。 


. IE M 是 如 下 的 NFA: 


. 设 G 是 正则 文法 ，M 是 根据 定理 6. 3. 1 从 G 获得 的 NFA。 证 明 : MR SSwC, ARATE M 中 存在 计算 


[5,9] P-[e,A] s 


. EL Æla, b,c) ERQIEWIS TE, BAP TIAS 13 1-56 AEE. 


a) iw|wel 并 且 w 以 aa 结尾 | 。 
b) Iiw|weL 或 者 w 包含 一 个 al 。 
c) |wlwgL#HE w REE alo 

d) juv|ueL##H vL}. 


. 证 明正 则 语言 族 在 集合 的 差 的 作用 下 是 封闭 的 。 
. 证 明正 则 语言 族 和 上 下 文 无 关 语 言 的 交 不 是 封闭 的 。 即 是 ， 如 果 工 是正 则 的 ，L, 是 上 下 文 无 关 的 ， 那 么 


LOL, 不 一 定 是 正则 的 。 


10. 正则 语言 族 在 无 限 并 作用 下 是 否 是 封闭 的 ? BU, MRL, Li, Li, EEN, U L 是 否 一 定 是 正 


“ls 


14. 


则 的 ? 如 果 是 ， 请 证 明 。 如 果 不 是 ,请 给 出 反例 。 

设 工 是 正则 语言 。 说 明 下 面 的 语言 都 是 正则 的 。 

a) 集合 P= lul wsLil 是 工 中 串 的 前 缀 。 

b) &&L'-Iw|weL| EL peii, 

c) 集合 E= lz| vsLil 中 的 串 在 工 中 具有 一 个 后 缀 。 
d) 集合 SUB = |v| wweL] PHA L 中 的 串 的 子 串 。 


. 设 工 是 包含 长 度 为 偶数 的 串 的 正则 语言 。 设 工 ' 是 语言 lx| uve L 并且 length(u) -length(v) |. WEH L’ 


是 正则 的 。 


. 利用 推论 6. 5. 2 说 明 下 面 的 每 一 个 集合 都 不 是 正则 的 。 


a) la,b} 上 的 具有 相同 数目 的 a Mb 的 串 的 集合 。 

b) {a,b} 上 的 长 度 为 偶数 的 回 文 串 。 

c) |(,)} 上 的 串 的 集合 ， 这 些 串 中 的 括号 是 成 对 的 。 例 如 入 ,(),()(),(())()。 
d) 语言 fle (ab)’(ca)” |i, j>0}。 

利用 泵 引 理 说 明 下 面 的 每 个 集合 都 不 是 正则 的 。 

a) 1a,b} 上 的 回 文 串 的 集合 。 

b) {a"b"|n<m|}, 

c) la'bic’ | iz0, j=0}。 

d) iww| we 1a, b}*}. 
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abaabaaabaaaab:-- ba" ba"*' b--- 


f) [a,b EAE, dip a 的 个 数 为 完全 立方 。 
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16. 
137. 


18. 


20. 
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22. 


23. 
24. 
25; 
26. 


2]: 


WEAR {a,b} 上 的 非 回 文 的 集合 不 是 正则 语言 。 

设 工 是 正则 语言 ，L, = | uu| ueL}。L, 一 定 是 正则 的 吗 ? 证 明 你 的 答案 。 
iL, 是 非 正则 语言 ，L, 是 任意 的 有 限 语 言 。 

a) WEB] L, UL, 不 是 正则 语言 。 

b) 证 明 L, - L, 不 是 正则 语言 。 

c) HHH L, 是 有 限 的 时 候 ，a) Alb) 的 结论 不 成 立 。 
给 出 1a,bl 上 的 满足 下 面 描述 的 语言 L 和 L, 的 例子 。 
a) L, 是 正则 的 ， L, 不 是 正则 的 ， L, UL, 是 正则 的 。 
b) L, 是 正则 的 ，L, 不 是 正则 的 ，LiUL; 不 是 正则 的 。 
c) L 是 正则 的 ，L; 不 是 正则 的 ，L, AL, 是 正则 的 。 
d) L 不 是 正则 的 ，L, 不 是 正则 的 ，L, UL, 是 正则 的 。 
e) L 不 是 正则 的 ， 但 是 L "是 正则 的 。 


. WL, ML, 是 两 个 字母 表 。 串 同 态 (String Homomorphism) AME! BDF 保持 连接 的 一 个 全 函数 ho 


h 满足 下 面 的 条 件 : 

i) h(A) =A. 

ii) h(uv) 2h(u)h(v), 

a) HL CE; 是 一 个 正则 语言 。 说 明 集合 |1A (w)|weLl,| fex. 上 是 正则 的 。 这 个 集合 叫做 L, Eh 
下 的 同 态 象 (Homomorphic Image) 。 

b) 设 L,C 3; 是 一 个 正则 语言 。 说 明 集 合 lwe 5? |h (w) eL) 是 正则 的 。 这 个 集合 叫做 L; 在 有 h 
下 的 逆 象 (Inverse Image) 。 

上 下 文 无 关 文 法 G=(V,,P,5) 称 为 的 右 线性 (Right-Linear) 的 ， 如 果 文 法 的 每 一 条 规则 具有 下 面 的 

形式 : 

i) Au, MH 

ii) A—uB 

Hp, A, BeV, ue X^ 。 利 用 6.3 节 之 中 的 方法 说 明 右 线性 文法 产生 的 恰好 是 正则 集合 。 

上 下 文 无 关 文法 G=(V, 荆 ,P,S) 称 为 的 左 正则 (Left-Regular) 的 ， 如 果 文 法 的 每 一 条 规则 具有 下 面 的 

ÉR: 

i) A>), 

ii) Aa, MA 

ii) A—Ba 

其 中 A, BeV, ae X 

a) 设计 一 个 算法 来 构造 接收 左 正则 文法 的 语言 的 NFA 

b) 说 明 左 正则 文法 产生 的 正好 是 正则 集 。 

上 下 文 无 关 文法 G=(V,2,P,S) MAAR (Left-Linear) 的 ， 如 果 文 法 的 每 一 条 规则 具有 下 面 的 

ÉR: 

i) Aou, mA 

ii) A—Bu 

其 中 , A, BeV, ue "。 说 明 左 线 性 文法 产生 的 正好 是 正则 集 。 

给 出 一 个 语言 工 使 得 = 只 有 三 个 等 价 类 。 

给 出 语言 w& 和 的 = 等 价 类 。 

设 [u] -, 是 语言 工 的 一 个 = 等 价 类 ， 说 明 如 果 [z] -包含 一 个 串 veL， 那么 [uj]- 中 所 有 的 串 都 在 工 

中 。 

WHN FRAKES L, =, 是 右 恒定 的 。 即 是 ， 如 果 usv, RAIER xe D*, A Wx=Lvx， 

其 中 三 是 工 的 字母 表 。 

利用 Myhill-Nerode 定理 证 明 语言 {e | i 是 完全 平方 数 | 不 是 正则 的 。 
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28. W ue[ab]., fll ve [aba]... ZEH 6.7.4 'P(aU b) (aU b" ) 的 等 价 类 中 的 串 。 说 明和 vw 是 不 可 区 分 
的 。 
29. 给 出 例 5.3. 1 H DFA 的 由 关系 三 w 定义 的 等 价 类 。 
30. 给 出 例 5.3.3 rH DFA WAKA = yu 定义 的 等 价 类 。 
“31. dt M, 是 在 定理 6. 7.4 和 定理 6.7.5 中 定义 的 接收 语言 的 最 小 状态 的 DFA。 i M 是 和 M, 具有 同样 数 
目的 接收 世 的 DFA。 证 明 M, 和 M 是 一 样 的 除了 (可 能 ) 它们 中 的 状态 图 的 名 字 不 一 样 。 这 样 的 两 个 
DFA 被 称 作 是 同 构 的 (Isomorphic) 。 


参考 文献 注释 


Kleene [1956] 中 提出 了 正则 集合 和 有 限 自 动机 接收 的 语言 是 等 价 的 。 在 6.2 节 中 给 出 的 证 明 利 
用 了 McNaughton 和 Yamada [1960] 中 的 模型 。Chomsky 和 Miller [1958] 确定 了 正则 文法 产生 的 语 
言 和 有 限 自 动机 接收 的 语言 的 等 价 性 。 在 同 态 下 的 封闭 性 (练习 19) 来 自 Ginsburg 和 Rose [1963b]。 
正则 集合 逆 的 封闭 性 由 Rabin 和 Scott [1959] 提出 。 此 外 ,在 Bar-Hillel, Perles 和 Shamir [1961] 以 
及 Ginsburg [1966] 和 Rose [1963b] 中 可 以 找到 正则 集合 结果 的 封闭 性 。 正 则 集合 的 泵 引 理 由 Bar- 
Hillel, Perles 和 Shamir [1961] 提出 。 语 言 的 等 价 类 的 数目 和 正则 性 之 间 的 关系 在 Myhill [1957] 和 
Neorde [1958] 中 得 到 了 确立 。 
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第 7 章 下 推 自动 机 和 上 下 文 无 关 语 言 


正则 语言 被 认为 是 由 正则 文法 产生 的 语言 和 被 有 限 自动 机 接收 的 语言 。 本 章 将 给 出 一 类 自动 机 ， 
叫做 下 推 自动 机 ， 它 接收 上 下 文 无 关 语言 。 下 推 自 动机 是 增加 了 额外 的 栈 内 存 的 有 限 状 态 机 。 额 外 的 
栈 提供 给 下 推 自动 机 后 进 先 出 的 内 存 管理 能 力 。 栈 和 状态 的 结合 克服 了 内 存 限制 ， 这 种 限制 使 确定 型 
有 限 自动 机 无 法 接收 语言 1a'b' | i20] 。 

和 正则 语言 一 样 ， 上 下 文 无 关 语言 的 泵 引 理 确保 了 上 下 文 无 关 语言 串 中 的 重复 子 串 的 存在 。 泵 引 
理 提供 了 一 种 技术 来 说 明 许多 很 容易 定义 的 语言 不 是 上 下 文 无 关 的 。 


7.1 下 推 自动 机 


定理 6. 5. 1 中 确定 了 语言 1a'b' | i=0| 是 不 能 够 被 任何 一 个 有 限 自动 机 接收 的 。 为 了 接收 该 语言 ， 
自动 机 需要 具有 记录 处 理 任意 有 限 个 a 的 过 程 的 能 力 。 自 动机 只 能 够 含有 有 限 个 状态 的 约束 ， 使 得 它 
不 能 “记录 ”在 一 个 任意 的 输入 串 的 前 面 已 经 处 理 过 的 a 的 个 数 。 通 过 对 有 限 自动 机 增加 根据 状态 、 
无 限 的 存储 进行 转换 的 能 力 ， 从 而 使 其 具有 使 用 无 限 内 存 的 能 力 ， 这 样 我 们 就 构造 出 了 一 种 新 的 自 
动机 。 
添加 一 个 下 推 栈 或 者 只 是 简单 地 添加 一 个 栈 到 有 限 自 动机 中 ， 就 构成 了 一 个 新 的 机 器 ， 即 下 推 自 
动机 (PDA) 。 栈 操作 只 影响 栈 顶 的 元 素 ， 出 栈 将 栈 顶 的 元 素 从 栈 中 删除 ， 而 进 栈 则 将 一 个 元 素 放 到 
栈 项 。 定 义 7.1.1 对 下 推 自动 机 的 概念 进行 了 形式 化 。PDA 的 各 个 组 成 部 分 Q、 玩 、g。 和 下 与 有 限 自 
动机 中 的 相同 。 

定义 7.1.1 一 个 下 推 自动 机 (pushdown automaton) 是 一 个 六 元 组 (Q, X,D,6,4,,F), 其 中 Q@ 是 
状态 的 有 限 集 ， 也 是 输入 字母 的 有 限 集 ，T 是 栈 字母 表 的 有 限 集 合 ，qdu 是 开始 状态 ,FCQ 是 终止 状 
态 的 集合 , BU QXxCEUIXID) x(TUIAI)8] Qx (TU {A} ) aT 4E 65464 AIC 

PDA 具有 两 个 字母 表 : AHA HE EA FERL, KERR, IOGXTENUEE 
栈 中 。 栈 表示 为 栈 元 素 的 一 个 串 ， 栈 项 的 元 素 是 串 中 的 最 左 字符 。 我 们 将 使 用 大 写字 母 来 表示 栈 元 
K, 希腊 字母 表示 栈 中 的 串 。 记 号 Aa 表示 栈 顶 元 素 为 4 的 栈 。 空 栈 记 为 和 。PDA 的 计算 开始 时 ， 机 
器 处 于 状态 qo. ， 输 入 在 磁带 上 ， 并 且 栈 为 空 。 

PDA 考虑 当前 的 状态 、 输 入 符号 和 栈 顶 符号 来 决定 机 器 的 转换 。 转 换 函 数 5 列举 了 给 定 状 态 、 符 
号 和 栈 顶 元 素 的 所 有 可 能 的 转换 。 








6( gq;,a,A) = | [q,,B] oLa.C] | 

上 面 的 转换 函数 的 值 表明 当 自动 机 在 状态 4 扫描 到 符号 a 并 且 栈 顶 为 4 时 具有 两 个 可 能 的 转换 。 
转换 会 导致 机 器 [9, BIES (4, a. A) 

i) 状态 从 gq, 改变 到 gj， | 

ii) 处 理 符号 a (带头 前 移 ) | 

iii) 将 4 从 栈 顶 删除 (弹出 栈 ) A 新 状态 当前 栈 顶 

iv) 将 B 压 入 栈 顶 。 新 材 项 当前 输入 符号 

因为 可 能 为 一 个 机 器 格局 指定 了 多 个 转化 ， 因 此 PDA 是 非 确 SEIS 
定型 自动 机 。 


下 推 自动 机 也 可 以 用 状态 图 来 描述 。 弧 上 的 标记 表明 输入 和 栈 操作 。 转 换 5(q,,a,A) = 1[q;,B]] 


描述 为 : 
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符号 /表示 替换 : A/B 表明 A 蔡 换 栈 顶 的 符号 B. 

转换 函数 的 定义 域 为 Qx(ZUfXl) x (TUI1X})， 它 说 明和 可 以 出 现在 一 个 转换 的 输入 或 者 栈 
顶 的 位 置 。 一 个 入 指定 了 组 件 上 的 值 既 不 会 被 考虑 也 不 对 转换 起 作用 ， 转 换 的 应 用 由 非 入 的 位 置 完 全 
决定 。 

当 入 作为 一 个 在 转换 函数 的 栈 位 置 的 参数 出 现时 ， 只 要 当前 状态 和 输入 符号 与 转换 中 的 相 匹配 ， 
就 可 以 应 用 转换 ， 而 不 用 考虑 栈 中 的 状态 。 栈 顶 可 以 包含 任何 的 符号 或 者 栈 为 空 。 只 要 机 器 处 于 状态 
q 并 扫描 到 a， 就 可 以 应 用 转换 [4;,B] e8(4,,a,X) 。 转 换 的 应 用 会 导致 机 器 进入 状态 g,， 并 将 符号 B 
添加 到 栈 顶 。 

符号 入 可 能 出 现在 一 个 转换 的 新 的 栈 位 置 处 ，[g ,入 ] s5(qi,a,4)。 在 执行 这 样 的 一 个 转换 时 ， 
将 不 会 把 任何 符号 压 人 栈 中 。 我们 将 会 看 几 个 例子 ， 从 而 了 解 PDA 转换 中 入 会 产生 怎样 的 影响 。 

如 果 输 入 位 置 是 入， 那么 转换 不 处 理 输入 字符 。 所 以 转换 G) 出 栈 和 (ii) 将 栈 符 号 4 HEARS 
中 ， 而 不 改变 状态 和 输入 。 ; 

i) [4,,X] €6(q,,4,A) 

NAN 


ii) [g,,A] e8(q;,A,X) 


iii) [q ,入 ] e6(q;,a,A) 


如 果 转 换 指定 的 动作 在 新 的 栈 顶 位 置 是 和 [9 ， 和 ] ， 那 么 将 不 会 把 任何 符号 压 入 到 栈 中 。 转 换 (ii) 
中 的 PDA 等 价 于 一 个 有 限 状态 自动 机 。 是 否 可 以 应 用 转换 是 由 状态 和 输入 符号 决定 的 ， 转 换 并 不 会 
考虑 或 者 更 改 栈 。 
PDA 的 格局 由 三 元 组 [qi,w,aj] 来 描述 ， 其 中 a; 是 机 器 状态 ，w 是 未 处 理 的 输入 ，c 是 栈 。 记 号 
[awa] hc [q;,v.,8] 
表明 格局 [gj,v,B] 可 以 从 [asw,a] 通 过 DEFA M 的 一 次 转换 获得 。 和 前 面 的 一 样 ， 丘 描述 了 一 系 
列 转换 的 结果 。 当 不 存在 歧义 的 时 候 ， 可 省 略 写 在 下 方 的 M。PDA 的 计算 是 一 系列 从 机 器 的 初始 状态 
和 空 栈 开始 的 转换 。 
我 们 现在 要 构造 一 个 接收 语言 1aib' | i20] f PDA M, 在 计算 开始 时 ， 输 入 串 为 w， 栈 为 空 。 处 
理 输入 符号 a 导致 4 被 压 入 栈 中 。 处 理 b 出 栈 ， 则 匹配 5b 和 a 的 个 数 。 下 图 展示 了 输入 串 为 aabb 时 ， 
M 的 计算 过 程 。 
M:Q={ 4.41 | anA bA/X 
X = {a,b} (> [go abb ,X] 
T={A} 
Beda NAA : 
6(q9,a,X) 21[49,A]1 [qo bb, AA] 
8(qo,b,A) ={[41,A] | F{q,,b,A] 
8(q ,b,A) ={Lq,A]} [4 A.X] 
输入 ae ，M 处 理 整 个 串 ， 并 停止 在 接收 状态 ， 此 时 栈 为 空 。 这 些 条 件 是 PDA 的 接收 准则 。 
定义 7.1.2 i£ M- (Q, X,D,05,q4,,F) € PDA, de ZEE — ^X 
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[q4,,w,X] F[q;,d,d] 
HP, geF, MF we 器 "被 M 接收 。M 的 语言 记 做 L(M)， 它 是 M 接收 的 字符 囊 的 集合 。 
一 个 接收 串 的 计算 称 作 是 成 功 的 。 处 理 整个 输入 并 终止 在 非 接收 状态 的 计算 称 作 是 不 成 功 的 。 因 为 
转换 函数 的 非 确定 性 ， 某 些 计算 可 能 不 能 完全 处 理 完 输 入 串 。 这 种 形式 的 计算 也 被 认为 是 不 成 功 的 。 
PDA 的 接收 遵循 非 确定 型 自动 机 的 标准 模式 。 处 理 完 整个 串 并 停止 在 接收 状态 的 一 个 计算 足以 说 
明 串 在 该 PDA 的 语言 中 。 存 在 其 他 的 不 成 功 的 计算 并 不 影响 串 的 接收 。 
例 7.1.1 PDA M 接收 语言 |wcw" | we [a,b] +。 采用 栈 来 记录 处 理 过 的 w。 栈 符号 4 和 中 分 别 
表示 输入 的 是 a 和 b。 
M:Q-(4, gj ldo 4.) 7([a,, AT} b)/B bB/\. 
E={a, b, c} 5(G b) ={lg, Bl} KA aa 
T={4, B} (q,.0.3) ={[9,, A]) 


F={q,} 5(9,, a, A)={[q,, AJ} 二 


5(q,, b, B={[q,, NJ} 


一 个 成 功 的 计算 在 处 理 到 w 的 时 候 会 于 栈 中 记录 w。 一 旦 遇 到 c 则 进入 接收 状态 q, R PEEK 
串 表 示 为 w 。 用 余下 的 输入 和 栈 中 的 元 素 匹 配 来 完成 计算 。M 处 理 输入 abcba 的 计算 为 
[go ,apcpa, 入 ] 
I- [q,,bcba,A] 
k [qa ,cba,BA] 
I- [4, ,ba,BA] 
ur [4 ,a,A] 
= [4 ,入 入] LI 
PDA 是 确定 的 ， 如 果 对 于 每 一 个 状态 、 输 入 符号 和 栈 顶 的 组 合 ， 最 多 存在 一 个 可 以 应 用 的 转换 。 
两 个 转换 Lg),C] e9(4,,u,A) All q,,D] e8(q,,v, B) EERE ( Compatible) ， 如 果 满 足下 面 的 任 
何 一 个 条 件 : 
i) u=v}#H A- B 
ii) uzvJtfH AzA MH B= 
ii) A-BJH uzA MA v= 
iv) u=A MA v= FFA A=\ MH B=) 
兼容 转移 可 以 应 用 到 相同 的 机 器 格局 中 。 如 果 一 个 PDA 不 包含 不 同 的 ， 那 么 它 就 是 确定 的 。 例 7.1.1 
中 的 PDA 和 构造 的 接收 fa | 120] 的 自动 机 都 是 确定 的 。 
例 7.1.2 语言 L={a'|i>0} Ua'b'|i=01| 包 含 完 全 由 a 组 成 的 串 或 者 具有 相同 数目 的 a 和 4b 的 
tB, Bl L 的 PDA M 的 栈 会 保留 一 个 已 处 理 的 a 的 个 数 的 记录 ， 直 到 遇 到 一 个 b 或 者 输入 串 被 处 理 
完成 。 a MA b A/X 
HERS o 扫描 到 a 时 ， 存 在 两 个 相 容 的 转换 。 具 有 形式 
ab' (i>0) 的 串 ， 被 一 个 处 在 状态 m Allg, 的 计算 接收 。 如 果 进 入 gq, 的 M: 
转换 跟随 着 处 理 a 中 的 最 后 的 一 个 a， 则 栈 被 清空 ， 并 且 接 收 输入 。 以 
任何 其 他 的 方式 到 达 状 态 9 ， 将 导致 计算 不 成 功 ， 因 为 在 状态 a, 之 后 
不 会 处 理 输入 。 
入 -转换 允许 M 任何 时 候 进 入 9 ， 只 要 它 处 于 状态 go。 这 个 转换 将 
非 确定 性 引入 到 M 的 计算 中 。 接 收 串 a^ 的 计算 在 状态 qu 处 理 整个 串 ， 
转换 到 q, ， 清 空 栈 ， 并 接收 串 。 
例 7.1.3 1a,b} 上 的 长 度 为 偶数 的 回 文 串 可 以 被 下 面 的 PDA 接收 
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BN, L(M) ={ww*|wela,b}*}. 一 个 成 功 的 计算 在 处 理 串 w 时 一 直 处 于 状态 go ， 并 且 一 旦 读 到 w^ 
的 第 一 个 符号 就 会 进入 状态 qus 5007. 11 中 的 串 不 同 , 工 中 的 串 并 不 ji eer 
包含 一 个 中 间 的 标记 ， 该 标识 使 得 状态 从 qu 转换 到 q, 。 非 确定 型 允许 机 gu y dx 
器 猜测 何 时 到 达 串 的 中 间 。 到 状态 qu 的 转换 ， 如 果 不 是 在 处 理 完 w 

后 的 一 个 元 素 时 立即 出 现 ， 则 将 导致 计算 不 成 功 。 M: Xg AM 


在 第 5 章 中 ， 我 们 展示 了 确定 型 和 非 确 定型 自动 机 接收 同一 全 A 
族 。 非 确定 型 在 设计 功能 的 时 候 是 有 用 的 ， 而 它 并 不 增加 自动 机 接收 串 的 能 力 。 但 是 这 对 下 推 自动 机 
却 不 成 立 。 

从 例 7. 1. 3 中 我 们 知道 ， 不 存在 接收 语言 L = 1ww'|wela,b|] “| 的 确定 型 下 推 自动 机 。 我 们 来 
直观 地 考虑 PDA 接收 语言 L 所 需要 的 性 质 。 wn PDA 的 计算 以 从 左 到 右 的 形式 处 理 输入 ， 所 以 自动 
机 并 不 能 够 确定 什么 时 候 前 半 部 分 输入 已 经 读 完 。 而 在 例 7.1.3 中 的 非 确定 型 自动 机 就 不 会 引起 这 种 
问题 。 从 qu 到 a, 的 转换 表示 一 个 非 确定 型 的 猜测 : 正在 扫描 的 符号 是 第 二 个 w 中 的 第 一 个 符号 。 对 
二 个 工 中 的 串 ， 总 有 一 个 猜测 是 正确 的 ， 这 使 得 计算 能 够 匹配 后 半 部 串 和 栈 中 的 元 素 ， 并 接收 输入 。 

考虑 一 个 确定 型 PDA 处 理 下 面 输入 串 时 的 可 能 动作 : 

aabbaa 和 aabbbbaa 
当 读 到 串 的 前 半 部 分 的 a 或 者 b 时 ， 相 应 的 栈 符号 4 或 者 召 被 压 人 到 栈 中 ， 这 将 被 用 于 比较 后 半 部 分 
的 输入 。 读 完 前 三 个 字符 ， 栈 中 的 符号 为 BAA, 不 管 处 理 的 是 哪个 串 ， 下 一 个 输入 符号 都 是 b。 为 了 
接收 aabbaa， 必 须 出 栈 ， 以 便 开 始 用 aab 匹配 paa。 然 而 ， 如 果 接 收 的 是 aabbbbaa, 那么 自动 机 必须 
把 B 压 人 栈 中。 确定 型 机 器 对 这 种 配置 只 有 一 种 选择 ， 因 此 两 个 串 中 必 有 一 个 不 被 接收 。 

确定 型 下 推 自动 机 接收 的 语言 包括 所 有 的 正则 语言 ， 以 及 上 下 文 无 关 语 言 的 一 个 适当 的 子 集 。 这 
个 语言 族 对 于 编程 语言 的 设计 是 非常 重要 的 ， 它 由 LR(k) 文 法 产生 的 语言 组 成 。 用 LR(k) 文 法 定义 语 
言 和 确定 性 分 析 将 在 19 章 中 介绍 。 


7.2 PDA 的 变种 


下 推 自动 机 经 常 使 用 与 定义 7.1. 1 稍 有 不 同 的 形式 进行 定义 。 在 本 节 中 ,我 们 将 介绍 几 种 不 同 的 
定义 ， 它 能 保存 接收 的 语言 。 

除 改变 状态 以 外 ，PDA 的 转换 还 包括 其 他 的 三 个 动作 : 出 栈 ， 将 一 个 元 素 人 栈 以 及 处 理 输 太 符 
号 。PDA 称 为 是 原子 的 〈atomic) ， 如 果 每 一 个 转换 只 引发 这 三 个 动作 中 的 一 个 。 原 子 PDA 具有 下 面 
的 形式 

i) [gN] € (q,,a,X) 

ii) [9,4] e8(q,, A, A) KA 

ii) [g,,A] €8(q,,, X). 

很 显然 ， 每 一 个 原子 PDA 是 都 是 定义 7. 1.1 中 的 一 个 PPA。 定 理 7.2.1 说 明了 原子 PDA 接收 的 
语言 和 其 他 的 PDA 接收 的 语言 是 一 样 的 。 此 外 ， 它 给 出 了 一 个 从 任意 的 PDA 构造 等 价 的 原子 PDA 的 
THE. 

定理 7.2.1 设 M 是 一 个 PDA。 则 存在 一 个 原子 的 PDA M', 4&4: L(M’) =L(M)。 

WEBB: 为 了 构造 M'， 我 们 用 一 系列 的 原子 转换 替换 M 中 的 非 原子 转换 。 设 [9,,B] e5(q,,a,A) e 
M 的 一 个 转换 。 原 子 等 价 需 要 两 个 新 的 状态 pi 和 p,， 以 及 下 面 的 转换 

[p , A] &8(4;,a,X) 
(p, A,A) = 1p, MI 
6(p, ,入 ,入 ) = | [4;,B] | 
来 实现 与 非 原 子 单 步 转换 相同 的 结果 。 

用 类 似 的 方式 ， nu c 
替换 。 用 一 系列 的 原子 转换 替换 所 有 的 非 原 子 转换 将 获得 一 个 等 价 的 原子 PDA, 

扩展 PDA 的 转换 ， 使 得 PDA 每 次 压 人 一 串 元 素 到 栈 中 ， 而 不 是 单个 元 素 。 M € 
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6(qi,4,4) 将 BCD 压 人 到 栈 中 ， 从 而 B 成 为 了 新 的 栈 顶 。 包含 扩 展 转换 的 PDA KAP EW PDA, X 
种 明显 的 一 般 化 并 没有 增加 下 推 自动 机 接收 语言 的 能 力 。 每 一 个 扩展 的 PDA 都 可 以 转换 成 与 定义 
7.1.1 中 的 形式 等 价 的 PDA。 
为 了 从 一 个 扩展 的 PDA 构造 一 个 PDA， 需要 将 扩展 转换 转化 为 一 系列 简单 的 转换 ， 这 些 转 换 每 
次 只 将 一 个 栈 符号 压 人 栈 中 。 一 次 将 大 个 元 素 压 人 栈 中 的 扩展 转换 ， 需 要 大 - 工 个 额外 的 状态 才能 够 达 
到 。 转 换 的 序列 
[P ,D] €6(4,,a,A) 
(p, ,入 入 ) ={[p,,C]} 
6CP ,入 入 ) 21[4;,B]] 
KE BCD 压 人 栈 中 ， 并 使 自动 机 处 于 q; 状态 。 连 续 地 执行 这 三 个 转换 将 获得 与 执行 单一 的 扩展 转换 
[a;,BCD]e 6(gq;;a,A) 一 样 的 结果 。 前 面 的 讨论 可 以 概括 为 定理 7.2.2。 
定理 7.2.2 设 M 是 扩展 的 PDA, 则 存在 PDA M', 使 得 L(M'’) =L(M)。 
例 7.2.1 设 L=|ab”|i=1} ,分别 构造 接收 L 上 的 标准 PDA， 原子 PDA 和 扩展 的 PDA。 每 个 自 
动机 具有 相同 的 输入 字母 表 {a，b| 、 栈 字母 表 |A| 和 接收 状态 q;。 状 态 和 转换 如 下 : 


PDA 原子 PDA 扩展 的 PDA 

Q= 140591542 | Q= 140591592593 +94! ` Q-14,,41l 

8(49,4,X) = 1 [45,41] 8(49,a,X) = 1 [ 43,11 8(49,a,X) = |[go,44]| 
Sla, A) = 1[49,A]1 6(043 ,入 入 ) = 1[45,A]1 8(qo,b,A) = l[ai,X]] 
8(qoy,b,A) =1[9 1I 8(45,N,X) = 1[49,A]1 6(q1,b,A) ={[q,]} 
8(q,,5,A) 2 lLa 11 5(90,5,r) = 1L a4, 1] 


6( 44 MA) T { [ai I 
5(q ,b,X) = | [44 rT} 


正如 所 期 望 的 那样 ， 原 子 PDA 比 标准 PDA 需要 更 多 的 转换 ， 而 扩展 的 PDA 则 需要 较 少 的 转换 。 
栈 符号 A 用 来 记录 匹配 的 5 的 个 数 。 扩 展 转 换 8( qo,a,A) = | [go,44]:} 一 次 将 两 个 计数 压 人 栈 中 。 为 
了 达到 同样 的 结果 ， 标 准 的 PDA 需要 两 步 转换 而 原子 PDA 需要 三 步 转换 。 O 

根据 定义 7. 1.2， 如 果 存 在 一 个 计算 ， 它 处 理 完整 个 串 并 停止 在 接收 状态 而 且 栈 为 空 ， 那 么 串 被 
接收 。 这 种 接收 称 为 被 终结 状态 空 栈 接收 。 单 独 以 终结 状态 或 者 栈 格局 的 形式 定义 接收 并 不 改变 下 推 
自动 机 识别 的 语言 的 集合 。 

如 果 存 在 计算 [qo,w, 和 ] 请 [g ,入 ,a] ,那么 串 w 被 终结 状态 接收 ,其 中 g 是 接收 状态 ,a eT"。 即 ， 
存在 一 个 处 理 完 串 并 终止 在 接收 状态 的 计算 。 终 止 时 的 栈 内 容 与 是 否 被 终结 状态 接收 是 不 相关 的 。 
被 终结 状态 接收 的 语言 记 做 Leo 

引 理 7.2.3 工 是 被 PDA M=(Q,,T,6,qo,F) 终 结 状态 接收 的 语言 。 那 么 ;存在 一 个 被 终结 状态 
Z AK L$ PDA, 

证 明 :PDA M' = (QU {q}, X T ,8,q,, 1 q,] ) 是 通过 在 M 中 增加 状态 a, 和 与 4 相关 的 转换 获得 
的 。 直 观 地 ，M 的 接收 串 的 计算 应 该 和 M 中 的 一 样 ， 除 了 额外 的 清空 栈 的 转换 。 转 换 函 数 8' 通 过 在 5 
中 增加 下 列 转换 而 获得 : 

6'(gi,N,N) =| [aA] | 对 所 有 的 q; € F 
8'(q;,4,A) = 1 [gj, 和 | 对 所 有 的 AeT 
设 [go,w, 和 ] br [a,i a] Æ M 中 终结 状态 接收 w 的 计算 。 在 M' 中 ,通过 进入 接收 状态 9, 并 清空 栈 来 完 
成 该 计算 
[ qo ,w,\] 
kla, a] 
hr g,,d,o] 
hr [ gy, 入 ,入 ] 
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展示 了 M' 中 如 何 接 收 w。 

我 们 必须 保证 新 的 转换 不 会 导致 M' 接 收 不 在 L(M) 中 的 串 。M' 中 惟一 的 接收 状态 是 qg, RAY 
一 个 转换 是 从 M 的 任意 接收 状态 开始 时 才能 够 进入 gj。 因为 转移 到 gj 的 转换 并 不 处 理 输入 ， 所 以 如 
果 进 入 q 时 有 未 处 理 的 输入 就 会 导致 计算 失败 。 因 此 ， 串 w 被 M' 接 收 当 且 仅 当 M 中 存在 一 个 计算 ， 
该 计算 处 理 完整 个 w 并 终止 在 M 的 接收 状态 。 这 就 是 说 ，wEeL(M') 4 A124 weL(M). [| 

如 果 存 在 计算 [qo,w, 和 A] HLA A], WI w 被 空 栈 接收 对 于 计算 终止 的 状态 gq; 没有 限制 。 当 
定义 一 个 空 栈 接收 时 ， 有 必要 要 求 至 少 存在 一 个 转换 来 允许 接收 不 包含 空 串 语言 。 空 栈 接收 的 语言 记 
为 Le(M)。 

引 理 7.2.4 设 L 是 PDA M=(Q, 了 ,TT,6,go) 空 栈 接收 的 语言 。 那么 ， 存 在 终结 状态 空 栈 接收 工 
的 PDA M', 

证 明 : 1 M'-(QUÍIa'I, Z,D,0',q,,Q), KrBXxIfg—^ q;eQ,xe XUIAHRIAETUIAL MA 
8'(q,,x,A) =8( qi, X, A) ,0' (qux, A) 20(q,,x,A).« 原始 自动 机 的 每 一 个 状态 都 是 M' 的 一 个 接收 

M' 和 M 的 计算 是 一 样 的 ， 除 了 M 和 M' 中 分 别 以 状态 go 和 qo 开始 外 。M' 中 长 度 大 于 1 的 计算 终 
止 时 栈 为 空 ， 同 时 也 终止 在 接收 状态 。 因 为 qo 不 是 接收 状态 , 所 以 M' 接 收 空 串 当 且 仅 当 它 被 M 接 
Wee BEL LCM’) 2L4CM) 。 

738 7. 2. 3 和 引 理 7. 2. 4 说 明了 终结 状态 或 者 空 栈 接收 的 语言 都 可 以 被 终结 状态 空 栈 接收 。 练 习 
8 和 练习 9 说 明了 终结 状态 空 栈 接收 的 语言 同时 也 可 以 被 具有 较 少 约束 形式 的 下 推 自动 机 接收 a 这些 
观察 得 到 了 下 面 的 定理 。 Er 

定理 7.2.5 下 面 三 个 条 件 是 等 价 的 : 

i) L 3k X /* PDA 接收 。 

ii) 存在 PDA M, ,L,(M,) 2L, 

iii) 存在 PDA M,,L,(M,) =L, 

我 们 已 经 见 过 了 标准 PDA 模型 的 几 种 变形 , 这 主要 是 通过 
改变 接收 准则 和 转换 形式 实现 的 。 另 一 种 普遍 的 修改 是 假设 存 
在 用 于 标记 栈 底 的 可 区 别 的 元 素 。 这 种 修改 可 以 读 取 栈 底 标 
记 ， 但 是 不 能 出 栈 。 通 过 读 取 栈 底 符号 来 允许 机 器 识别 空 栈 并 
采取 相应 的 动作 。 下 面 的 例子 展示 了 栈 底 标 记 并 说 明了 在 标准 Xb) 
的 PDA 中 如 何 模 拟 。 

例 7.2.2 下 推 自动 机 M 由 下 面 的 转换 定义 

它 接收 具有 相同 数目 的 a 和 4。 的 串 。 栈 符号 Z 扮演 栈 底 标 
记 的 角色 ; 在 第 一 个 转换 中 将 它 放 到 栈 中 并 在 整个 计算 中 一 直 
维持 在 栈 底 。 

栈 记 录 已 经 读 过 的 a Hb 的 数目 的 差 。 如 果 自 动机 处 理 的 a 比 b 多 n 个 ， 那么 栈 中 将 包含 n 个 A; 
类 似 地 ， 栈 中 包含 n 个 B 表明 处 理 过 的 b 比 a 多 nn 个 。 当 读 到 栈 底 标 记 Z 时 则 表明 处 理 到 的 a 和 4b 的 
数目 相等 。 计 算 i 





[qo , abba, X] 
上 [ai , abba ,Z] 
I-[q, ,bba,Z] 
I-[4, ,bba, AZ] 
I-La ,ba,Z] 
E- 3:52.21 
I [3,, 2; BZ] 
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F[q,,A,Z] 
EL q4 oy he 
展示 了 接收 abba, A] a 并 且 栈 顶 是 4 或 者 Z 时 ， 通 过 进入 状态 中 将 一 个 4 添加 到 栈 中 ,并 
返回 到 qo MARGE ， 则 在 状态 q 出 栈 ， 因 为 读 到 的 a 减少 了 处 理 到 的 a 和 4b 数目 的 差 。 当 读 到 
b 时 ， 应 用 类 似 的 策略 。 
自动 机 惟一 的 接收 状态 是 9,。 如 果 输 入 串 中 具有 相同 数目 的 a 和 4b， 转移 到 q 的 转换 将 会 弹出 Z， 
并 终止 计算 。 回 
接收 相同 语言 的 下 推 自动 机 的 各 种 变形 展示 了 采用 栈 存 储 接收 的 健壮 性 。 在 下 一 节 中 ， 我 们 将 展 
示 下 推 自动 机 接收 的 语言 正好 是 上 下 文 无 关 语 言 。 


7.3 上 下 文 无 关 语 言 的 接收 


在 第 6 章 中 ,我们 介绍 了 正则 文法 产生 的 语言 和 DFA 接收 的 语言 一 样 。 本 节 将 继续 讨论 文法 产生 的 
语言 和 自动 机 接收 的 语言 的 关系 。 下 推 自动 机 作为 上 下 文 无 关 语言 的 接收 器 ， 它 的 特征 是 通过 确定 
PDA 的 计算 和 上 下 文 无 关 文法 的 推导 之 间 的 关系 获得 的 。 

首先 我 们 将 证 明 ， 每 一 个 上 下 文 无 关 的 语言 可 以 被 一 个 扩展 的 PDA 接收 。 为 了 完成 证 明 ， 我 们 
采用 文法 的 规则 来 产生 等 价 的 PDA 的 转换 。 设 工 是 上 下 文 无 关 的 语言 ，G 是 满足 格 立 巴赫 范式 的 文 
ik, FFAL(G) =L。G 的 产生 式 规则 ， 除 8- 六 之 外 ， 具 有 如 下 形式 : 4->ah14,…A,。 在 最 左 推导 之 
中 ， 必 须 以 从 左 到 右 的 顺序 处 理 变量 A, 。 将 变量 A, A, …4, 按 推导 所 需要 的 顺序 压 和 人 栈 中 。PDA 具有 
两 个 状态 : 开始 状态 g 和 接收 状态 9 。 形 式 为 S 一 a4,4;…4, 的 推导 规则 S 产生 一 个 转换 ， 这 个 转换 
处 理 终结 符 a, Ki AA A, 压 人 栈 中 ,并 进入 状态 % 。 计 算 的 剩 下 部 分 是 利用 输入 符号 和 栈 顶 来 决定 
适当 的 转换 。 

下 面 用 接收 语言 1a'b'| i» 0] 的 格 立 巴赫 范式 文法 G 来 展示 如 何 构造 等 价 的 PDA 


G: S—aAB| aB 
A—aAB | aB 
B—b 
等 价 PDA 的 转换 函数 直接 从 G 的 产生 式 规则 定义 ; 
ó(q,. a2.) -([q,, AB].[q,, B]) ets 
5(q,, a,4)- ([a, ABI [a,, B1) bene 
s aw (N 


ó(q,, b,B) ={[g,, Al} ` @) aX/AB Gy 


下 面 处 理 串 aaabbb 的 计算 展示 了 格 立 巴赫 范式 文法 的 推导 和 相应 的 PDA 的 计算 之 间 的 关系 。 


S =aAB [ qo ,aaabbb,\] [q ,aabbb , AB | 
—aaABB I-[ 4, ,abbb , ABB] 
—aaaBBB Ht q, ,bbb, BBB | 
—aaabBB -[q, ,bb,BB] 
—aaabbB I-[4,,5,B] 
—aaabbb [gs 3] 





推导 产生 一 个 前 绥 终 结 符 后 紧 跟 着 后 绥 变 量 的 串 。 处 理 输入 符号 对 应 着 推导 之 中 的 该 变量 的 产 
HE, PDA 的 栈 中 包含 导出 串 中 的 变量 。 定 理 7. 3. 1 形式 化 了 这 种 从 格 立 巴 赫 范 式 文法 产生 等 价 的 PDA 
的 策略 。 它 说 明了 每 个 上 下 文 无 关 的 文法 都 能 够 被 一 个 PDA 接受 。 

定理 7.3.1 设 L 是 一 个 上 下 文 无 关 的 语言 。 那 么 存在 一 个 接收 工 8$ PDA, 

WEAR: 设 G=(V, 二 ,P,$) 是 产生 语言 工 的 格 立 巴赫 范式 文法 。 开 始 状 态 为 g 的 ， 接 收工 的 扩展 
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的 PDA M 的 定义 如 下 : 
Qu 714,4! 
Zu=Z 
Pl 
Fy = {4i} 
它 的 转换 
lma, X) = {lq w] | Saw e P} 
8(q,,a,A) =|[q,,w] | A>awePHAEV-=]{S}} 
56(q ,入 入 ) =1[9,,A] | WR S> EP 
接收 LL。 
首先 证 明 LEL(M)。 设 SSuw 是 一 个 推导 ,其 中 ue 卫 * ,we V*。 下 面 将 证 明 M 中 存在 计算 
Laosu, A] F- L4, w] i 
对 推导 长 度 进行 归纳 并 利用 G 中 的 推导 和 M 的 计算 之 间 的 关系 进行 证 明 。 
归纳 的 基础 是 含有 长 度 为 1 的 推导 SSaw。 规 则 Saw 产生 的 转换 能 够 得 到 所 要 求 的 计算 。 假 设 
由 推导 SSuw 产生 的 所 有 的 串 uw 在 M 中 存在 计算 : 
[qo,u,\] 1 q, ,入 ,W] 
现在 , Sy ww B—MES, HP usvae 了，meV*。 推 导 可 以 写成 ; 
: SSvAw, Suw 
其 中 ,w=wiw, H A—aw, Æ P 中 的 规则 。 归 纳 假设 和 转换 [q ,w ] e 65( gq, ,a,4) 相 结合 ， 得 到 计算 
[qo va, i] H{ q, ,a,Aw,] j 
^ta ,A,ww;] 
XE L 中 的 每 一 个 具有 整数 长 度 的 串 u, M 中 对 应 于 推导 Su 的 计算 接收 us 如 果 入 eL， 那 么 SA 
是 G 中 的 一 个 规则 ， 并 且 计算 [go, 入 ,入 ] Lai, A] eI B 
相反 ，L(M) EL， 即 是 证 明 对 于 每 一 个 计算 [gu,x, 入 ] PL ow], ，G 中 存在 与 之 对 应 的 推导 
S 过 uw。 证 明 通 过 对 计算 中 的 转换 的 数目 归纳 ， 将 留 做 练习 。 
为 了 完成 描述 上 下 文 无 关 的 语言 正好 是 下 推 自 动机 接收 的 语言 ， 我 们 必须 说 明 PDA 接收 的 每 一 
个 语言 都 是 上 下 文 无 关 的 语言 。 因 为 可 以 通过 自动 机 的 转换 构造 上 下 文 无 关 文法 的 规则 ， 所 以 规则 的 
运用 和 PDA 的 计算 中 的 转换 相对 应 。 为 了 简化 证 明 ， 我 们 将 这 个 过 程 分 成 四 个 阶段 : 
l. Æ PDA 中 加 入 的 转换 ， 使 得 语言 中 的 每 一 个 串 都 能 够 被 计算 接收 ， 并 且 该 计算 中 的 每 一 个 转 
换 都 包含 出 栈 和 入 栈 操作 。 
2. 从 修改 的 PDA 中 构造 文法 的 规则 。 
3. 给 出 一 个 展示 PDA 的 计算 和 文法 推导 之 间 的 关系 的 例子 。 
4. 最 后 ， 形 式 证 明文 法 和 PDA 的 语言 是 相同 的 。 
前 两 个 阶段 是 构造 性 的 一 一 添加 转换 和 构造 文法 规则 。 最 后 一 步 由 引 理 7.3.3 和 引 理 7. 3. 4 完成， 它 
说 明了 规则 产生 的 串 正 好 是 PDA 接收 的 串 。 首 先 从 任意 一 个 PDA M 开始 ,说 明 L(M) 是 上 下 文 无 关 
的 。 证 明 首 先 修改 M， 使 得 转换 能 够 转化 成 规则 。 
HM =(Q,2,0,6,4q),F)# PDA, 1E EI aL PDA M' 的 转换 函数 为 8 ， 它 在 M 的 转换 函数 8 上 
增加 了 如 下 的 转换 : 
i) 对 每 一 个 4 eT, 如 果 [ gj, 入 ] e8(q,,u,X) ,那么 [gj,A] E8 (q:,u,A), 
ii) 对 每 一 个 AeT, 如 果 [ 4,,B] elg, u, N), IRALL, BA] e6'(q;,u,A)。 
这 些 转换 的 解释 是 : M. 的 并 不 从 栈 中 删 出 一 个 元 素 的 转换 ， 可 以 看 成 是 一 个 初始 的 出 栈 操作 和 之 后 的 
用 同一 个 符号 替换 栈 项 的 操作 。 一 个 利用 新 的 转换 接收 的 串 的 计算 也 可 以 通过 原始 的 转换 获得 ; 所 
以 , L(M) L(M'), 
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MH G-(V,X,P,S) A M' 的 转换 中 构造 而 来 。G 的 字母 表 是 M' 的 输入 字母 表 。G 中 的 变量 包含 
开始 符号 S 和 形式 为 (q; ,4,9q,) 的 对 象 ， 其 中 gq 是 M' 的 状态 ,4 eTU | 入 } 。 变 量 (g,,4,g,) 表 示 一 个 从 
状态 9 开始 ， 以 9 结束 的 计算 ， 并 把 符号 A 从 栈 中 删除 。G 的 规则 定义 如 下 : 

1. $— Caos rd, 4j) , XI fg—T Gg eF 

2. 每 个 转换 [4g ,B] e6'(q;,x,A) ,其 中 AeTU1N}， 产生 下 面 规 则 的 集合 : 

| (qi,A,gq:)—x(g;,B,q.) | q.e QI 

3. 每 个 转换 [ q, BA] e6'(gq;,x,4) ,其 中 AeT, 产 生 下 面 规则 的 集合 : 

1(4,,A,4,) x(4,,B,4,) (4,,A,4,) | 4,,4, € Ql 

4. 对 每 一 个 状态 q, €Q, Ala X41) No 

推导 从 第 1 类 规则 开始 ， 这 类 产生 式 的 右边 表示 一 个 从 q 开始 ， 并 终止 在 接收 状态 的 计算 ， 该 计 
算 终止 时 栈 为 空 ， 换 名 话说 ， 即 是 M' 中 的 一 个 成 功 的 计算 。 第 2 类 和 第 3 类 规则 跟踪 机 器 的 动作 。 第 
3 类 规则 与 M' 的 扩展 转换 相对 应 。 在 一 个 计算 中 ， 这 些 规 则 增加 栈 的 大 小 。 相 应 的 规则 的 作用 是 在 推 
导 之 中 引入 额外 的 变量 。 

第 4 类 规则 用 来 终止 推导 。 规 则 《gq;， 和 ，4q〉 一 \ 表示 一 个 从 状态 'gi; 开始 到 其 自身 的 计算 ， 这 
个 计算 不 改变 栈 ， 即 它 是 一 个 空 计 算 。 

例 7.3.1 文法 G 是 从 PDA M 构造 出 来 的 ，M 的 语言 是 集合 la" cb" | nz0| 


M:Q- 14,4] 8(4,,a,X) ={1q,A]} 
Da fa, b c} 6( do CaA dE L] 
T={A} 8(q,,b,A) =\[q,A] | 
F= ial 


在 M 中 增加 转换 8 (ga,4) = 1[qs, AA] LRL (49, 0,4) = 1L ,4]} 来 构造 M'。 等 价 文法 G 的 规则 
和 从 这 些 文法 构造 而 来 的 转换 如 下 所 示 





转 换 规 则 
S 一 (90 ,入 ,91 
8(49,a,X) ={1q,A] | (dos^, go) >al Go A +90) 
(go, sgi) —a(49,4,41) 
8(qo,a,A) = | [q0,AA]} Cdo A, go) al go,A,qgo) (404540) 


(49,A,41) —a(4o ,A,q9) (40,4591) 

(40,4 ,40) —a(49,4,41) (41 4,40) 

(4o,A,4,) —a(49,A,41) 491 A591) 
8(49,0,X) = 1Lai 入]| (49,49) —c(41 ,入 ,go》 

(Go ,入 ,91 —5c(41,,41) 
6(qo,c,4) 2 1[a1,A]I (494,49) —c(di ,A,qo) 

(40 ,4,91 —5c(q ;4,91) 
6(q,,6,A) ={[q,,d]} (qi ,A,q9) —b(qi ,X,q9) 

(41 Aq, ) b(q hsg) 

(Go ,入 ,go —À 

Cdi Nsg) >A 


E 

PDA 中 的 计算 和 相关 联 的 文法 G 中 的 推导 之 间 的 关系 ， 采 用 例 7.3.1 中 的 PDA 和 文法 展示 出 来 。 

推导 以 应 用 规则 S 开始 ; 后 面 的 步骤 根据 M' 中 处 理 相 应 的 输入 符号 来 进行 。 最 左边 的 变量 的 第 一 个 

部 分 包含 计算 中 的 状态 。 最 右边 的 变量 的 第 三 个 部 分 包含 接收 状态 ;而 计算 将 终止 在 该 状态 。 连 接 变 
量 的 第 二 个 部 分 可 以 获得 栈 。 
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[ qo ,aacbb,) | $2(4,,4) 
I- [qy,acbb,A] =al qo, Aq) 
FF [qo cbb, AA] —4aa(q, ,A,4,) (4,,A,4) 
E [9 ,bb,AA] —aac(q, ,A,q,) (4 ,A.4) 
- [9,,b,A] —aacb(q, ,入 ,9 (d; 4 9》 
—aacb(q, ,A,q,) 
EST OX] i —aacbb(q, ,X,q,) 
—aacbb 


变量 (go ,q,) 可 以 通过 应 用 S 规则 获得 。 这 表明 从 状态 q 到 状态 q, 的 不 改变 栈 的 计算 就 是 所 需 
要 的 计算 。 后 面 规则 的 应 用 给 出 了 需要 一 个 从 状态 go 到 状态 q 的 从 栈 中 删除 4 的 计算 的 信号 。 第 4 
条 规则 的 应 用 显示 了 当 8 中 含有 不 从 栈 中 删除 符号 的 转换 的 时 候 ， 需 要 增加 转换 到 M 中 的 必要 性 。 规 
Jil Go 4,91 04g, A, 4, ) 表示 一 个 处 理 符 号 上， 但 并 不 将 A 从 栈 顶 删除 的 计算 。 

现在 ， 我 们 已 经 为 证 明 PDA 接收 的 语言 是 上 下 文 无 关 的 做 好 了 准备 。 将 结果 和 定理 7. 3. 1 结合 起 
来 就 可 以 得 到 ， 上 下 文 无 关 规 则 产生 的 串 和 下 推 自 动机 接收 的 串 是 等 价 的 。 

定理 7.3.2 设 M 是 一 个 PDA。 那 么 存在 一 个 上 下 文 无 关 的 文法 G， 且 L(G) =L(M), 

前 面 叙述 的 从 扩展 PDA M' 构 造 出 来 的 文法 G 和 M 是 等 价 的 。 必 须 说 明 存 在 一 个 推导 Sw, 24 
且 仅 当 对 某 些 gsE， 有 [qu,w 入 ] 片 [g ,入 入 ]。 下 面 的 引 理 7.3.3 和 引 理 7.3.4 将 展示 G 中 的 推导 和 
M' 中 的 计算 之 间 的 对 应 关系 。 

引 理 7.3.3 4e (4,,A,4) Sw, X'F we X' ,AeTULIAL ,那么 [gq,,w,A] i 

WEBB: 通过 对 终结 符号 串 的 推导 长 度 进行 归纳 来 证 明 本 引 理 ， 其 中 的 终结 符号 串 是 由 具有 la, 
A, q) 形式 的 变量 推导 出 来 的 。 归 纳 的 基础 是 串 的 推导 只 包含 一 个 简单 规则 的 应 用 。 空 串 是 能 够 通 
过 应 用 一 个 规则 推导 出 来 的 惟一 的 串 。 推 导 为 9 入 ,9 一 入 ， 它 应 用 了 第 4 类 规则 。 在 状态 q, 的 空 计 
算 产生 [aq 入 入 ] 请 [4 入 入 ] ;这 就 是 所 需要 的 。 

BEREC, A, qj) 三 v， 就 存在 计算 [gq;,v,A] Ha, A] Rw ARIETES B, CTIA la, 
A, q) Mit n+l 步 推导 而 获得 。 推 导 的 第 1 步 由 规则 2 和 规则 3 的 应 用 组 成 。 以 第 2 类 规则 开始 的 
推导 可 以 写成 

(4,,A,4;) 2u(q,,B,q,) 
Suv =w 
Hla, A, qg) ^u(q,,B,a;) J& G 中 的 一 个 规则 。 根 据 归纳 假设 ,存在 与 推导 (gq,,B,g,) v 相对 应 的 
Ya, vB] Aig, Alo 
G 中 的 规则 (gj,4 ,q,) —u(q,,B,q;) BFL qi,B]e6(g;,u,4) 产 生 。 将 这 个 转换 和 计算 结合 起 
来 ,根据 归纳 假设 可 得 
[q;,uv,A] Faq, v, B] 
F4, X] 
如 果 推 导 的 第 一 步 是 第 3 类 规则 ， 则 推导 可 以 写成 
(4,,A,4,) 2u(4,,B,4,) (4,,A,4;) 
5w. 
相应 的 计算 可 以 从 转换 [at,B4] e 6( gq;,u,4) 中 并 使 用 两 次 归纳 假设 构造 出 来 。 m 

引 理 7.3.4 Ae [q;,w,A] Ha, A], JEP AeTULIAL, 那么 存在 推导 (gq,,A,g)) 过 Ww。 

WEBB: 从 格局 .[q;, N, A] 得 到 的 空 计算 是 M 不 使 用 任何 转换 所 能 得 到 的 惟一 计算 。 相 应 的 推 
FORAN (q, M gi 一 入 的 简单 的 应 用 。 
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假设 每 一 个 计算 [av,4] Lg, AA] G 中 都 有 一 个 相对 应 的 推导 《qi ,4,9 v. 考虑 长 度 为 
n+1 的 计算 。 以 非 扩 展 转换 开始 的 指定 形式 的 计算 可 以 写成 如 下 : 
[gq;,w,A] 
- [4,,v,8] 
F- [4,,3,À] 
Hp wzuv3JFH[a,,B] e6(gq,;,u,4)。 根 据 归纳 假设 ,存在 推导 (gq B, q,) Sv. 第 一 个 转换 产生 G 中 
的 规则 9,4,g ug, ,B,9;) o LMC, A,B w 的 一 个 推导 可 以 通过 
(4,,A,4,) 2u(q,,B,q;) 
Sw 
来 实现 。M' 中 的 以 扩展 转换 [ gj,BA] e 6[ gq;,u， 4 开始 的 计算 具有 下 面 的 形式 
[q;,w,A] 


Ha, ,v,BA] 
F14,.y,A] 
Fg, A,A] 


其 中 w=w FFA v 2xy, HU (q, A,q) PU de Bs dm) (4,,A,4)) 由 计算 中 的 第 一 个 转换 产生 。 根 据 归 
纳 假设 ，G 中 包含 推导 
(q,,B,q,) 3x 
(444,4) >Y 
将 这 些 推导 和 前 面 的 规则 结合 起 来 就 能 够 从 (9,,4,9g; 中 获得 w 的 推导 。 m 
EH 7.3.2 的 证 明 : 设 w 是 L(G) 中 的 任意 的 串 ， 它 具有 推导 WT q,) ws 根据 引 理 
7.3.3， 存 在 计算 [qo,w, 和 ] klg, A], IRH M' 接 收 串 w 


相反 ， 如 果 weL(M) zL(M' s 那么 存在 计算 [qo,w; 和 ] we 该 计算 接收 Wo 5| 3 
7.3.4 证 明了 G 中 存在 相应 的 推导 (go Ag) wo 因为 9 是 接收 状态 ， 所 以 G 中 包含 规则 S— qo A, 
qi) o 在 文法 G 中 ， 用 此 规则 开始 前 面 的 推导 将 产生 wo | 


7.4 上 下 文 无 关 语 言 的 泵 引 理 


定理 6. 6.3 是 正则 表达 式 的 泵 引 理 。 它 说 明了 正则 语言 中 的 一 个 足够 长 的 串 一 定 具有 一 个 子 串 ， 
该 子 串 重复 出 现任 意 多 次 所 得 到 的 结果 串 仍然 在 该 语言 中 。 在 本 节 中 ， 我 们 将 给 出 上 下 文 无 关 语言 的 
泵 引 理 。 然 而 对 于 上 下 文 无 关 语 言 ， 泵 抽取 两 个 类 似 的 子 串 。 能 够 产生 具有 乔 姆 斯 基 范 式 文法 的 上 下 
文 无 关 语 言 的 这 种 能 力 ， 提 供 了 证 明 泵 引 理 所 需要 的 结果 。 

证 明 泵 引 理 过 程 中 有 两 个 里 程 碑 。 利 用 乔 姆 斯 基 范 式 文法 的 规则 可 以 构造 推导 树 。 使 用 推导 料 的 
性 质 ， 可 以 获得 数字 kk， 它 满足 : 

1. 任何 长 度 大 于 或 等 于 的 串 的 推导 一 定 具 有 一 个 递归 的 子 推导 A 过 vAx， 其 中 v, xe D*, IFA 

2. Av 和 x 能 够 同时 从 z 中 泵 出 来 ， 且 结果 串 仍然 是 在 该 语言 中 。 
二 叉 树 的 叶子 数目 和 深度 之 间 的 关系 用 来 实现 第 一 个 里 程 碑 ， 递 归 也 推导 的 重复 确定 了 后 者 。 乔 姆 斯 
基 范 式 文 法 的 推导 树 的 深度 和 串 长 度 之 间 关 系 在 引 理 7.4. 1 中 给 出 ， 并 且 在 推论 7.4. 2 中 进行 了 重 述 。 

引 理 7.4.1 设 G 是 具有 乔 姆 斯 基 范 式 的 上 下 文 无 关 的 文法 ，A 壹 w 是 具有 推导 树 工 Xs 

Pwe’ wRT MRE n, ABA length (w) <2"" 

证 明 : 通过 对 产生 终结 符 串 的 推导 树 的 深度 进行 归纳 来 证 明 本 引 孝 。 因为 G 是 乔 姆 斯 基 
范式 ， 推 导 树 的 深度 为 1 表示 产生 终结 符号 串 必 须 是 如 右 所 示 的 两 种 形式 中 的 一 种 。 在 任何 
一 种 情况 中 ， 推 导 串 的 长 度 都 小 于 或 者 等 于 2 =1， 满 足 条 件 。 

假设 该 性 质 对 所 有 深度 小 于 或 者 等 于 nn 的 推导 树 都 成 立 。 设 Aw 是 推导 树 了 的 一 个 长 和 a 
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度 为 n+1 的 推导 。 因 为 文法 是 乔 姆 斯 基 范 式 ， 所 以 推导 可 以 写成 4 一 BC 一 几 ， 其 中 Bu, C5v 以 及 
w zuv, A=>w 的 推导 树 可 以 由 Ts 和 Te xk, Bu 和 Cv 的 推导 树 如 右 图 pou. 

FERo WT, 和 Tc sidering UTEM no 根据 归纳 假设 ,length(u) <2" 

H length(v) x2" 。 因 此 length(w) = length( uv) <2", 


推论 7.4.2 ik G-(V, Y,P,S)X— (o Rae CREE 
KL, HH S2w 是 weL(G) 的 一 个 推导 。 如 果 length(w) 22^, RAI 
导 树 的 深入 至 少 是 元 +1。 


定理 7.4.3 (上 下 文 无 关 语 言 的 泵 引 理 ) 设 工 是 上 下 文 无 关 的 语言 。 Fe i t 

存在 一 个 依赖 于 工 ak, RAREST zeL, length(z) >k, 都 能 够 写成 z = uvwxy， 其 中 
i) length (vwx) <k 

ii) length (v) +length (x) »0 

ii) 对 任意 的 i20, A w'wr'yeL, 

证 明 : 设 G=(V,,P,5) 是 产生 语言 的 乔 姆 斯 基 范 式 文法 ,并 设 k=2”,n=card(V)。 下 面 
说 明 所 有 长 度 大 于 等 于 k 的 串 都 能 够 分 解 以 满足 泵 引 理 的 条 件 。 设 ze L(G) JE Fé — B, Sos 
是 G 中 的 一 个 推导 。 由 推论 7.4.2,， 在 Sz 的 推导 树 中 ， 存 在 长 度 至 少 是 n+1=card(V)+1 的 
路 径 。 

设 p 是 推导 树 中 从 根 S 到 叶 节 点 的 最 大 长 度 的 路 径 。 那 么 p 至 少 包含 n+2 个 节点 ， 除 叶 节 点 外 ， 
所 有 的 节点 都 标记 有 一 个 变量 ， 叶 节点 标记 为 一 个 终结 符号 。 铅 巢 原 理 保 证 了 至 少 有 一 个 变量 4 在 这 
条 具有 n+2 个 节点 的 路 径 中 出 现 两 次 。 虽 然 4 可 能 在 路 径 中 出 现 超过 两 次 , 但 是 我 们 只 关心 在 p 中 
最 后 的 出 现 和 紧 挨 着 最 后 的 出 现 。 

将 推导 树 中 路 径 的 性 质 转移 到 子 推导 中 ，z 的 推导 可 以 描述 如 下 : 


S 
; i 
u v x y 
Sth z 2uvwxy, HES SSr Ar, 产生 挨 着 最 后 一 次 出 现 的 变量 4。 在 应 用 推导 Aw ZA, SHES AS vAx 
可 以 被 去 掉 或 者 重复 任意 次 数 。 推 导 结果 产生 串 ww wxyeL(G) =L, 
现在 将 说 明 ， 这 种 分 解 能 够 满足 泵 引 理 的 条 件 (i) 和 条 件 〈ii) 。 子 推导 AS vAx 必须 从 形式 为 


4 一 BC 的 规则 开始 。 变 量 4 的 第 二 次 出 现 可 以 从 B 或 者 C 推 导出 来 。 如 果 它 从 B 推 导出 来 ， 那么 推导 
可 以 写成 : 





A BC 
=>vAsC 
=>vAst 
= vAx 
串 上 是 非 空 的 ， 因 为 它 是 由 乔 姆 斯 基 范 式 文法 中 的 一 个 变量 推导 而 来 的 ， 该 变量 不 是 文法 的 开始 符号 。 
Za, x 也 是 非 空 的 。 如 果 有 4 的 第 二 次 出 现 来 自 变量 C， 那 么 一 个 类 似 的 讨论 可 以 表明 v 也 一 定 不 是 
空 串 。 
在 路 径 p 中 ,4 的 最 后 两 次 出 现 之 间 的 子路 径 的 长 度 最 多 是 n+2。 由 推导 A vwx 产生 的 推导 树 
的 深度 最 多 是 n+1。 由 引 理 7.4.1， 串 vwx 可 以 由 长 度 小 于 等 于 k=2" 的 推导 获得 。 ia 
和 正则 语言 的 泵 引 理 一 样 ， 泵 引 理 为 表明 一 个 语言 不 是 上 下 文 无 关 的 提供 了 一 个 工具 。 根 据 泵 引 
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H, 上下文 无 关 文法 中 的 每 一 个 足够 长 的 串 都 可 以 泵 出 子 串 。 所 以 我 们 通过 找到 一 个 不 能 分 解 成 满足 
定理 7.4.3 描述 的 uvwxy GSKA ER, 来 说 明 一 个 语言 不 是 上 下 文 无 关 的 。 

例 7.4.1 HA L= [abd |i=0| 不 是 上 下 文 无 关 的 。 假 设 工 是 上 下 文 无 关 的 。 根 据 定理 7.4. 1， 
串 z=a rc ， 其 中 大 是 满足 泵 引 理 的 数 ， 能 够 分 解 成 满足 重复 性 质 的 子 串 uwwxy。 考 虑 子 串 v 和 x 的 
可 能 性 。 如 果 其 中 一 个 包含 多 于 两 种 的 终结 符号 ， 那 么 wwxzzy 包含 一 个 在 a 之 前 的 5b 或 者 在 b 之 前 
的 c。 任 何 一 种 情况 ， 结 果 串 都 不 在 工 中 。 

根据 前 面 的 观察 ，" A x DUE a. b' A c" 中 的 一 种 子 串 。 因 为 v 和 x 中 最 多 只 有 一 个 是 空 ， 所 
以 wiwxy 将 增加 一 种 ， 最 多 两 种 ， 但 不 可 能 是 三 种 终结 符号 的 长 度 。 这 表明 uv! wx! y 不 在 中 。 所 
VA, 不 存在 abt 的 一 个 分 解 ， 使 得 其 满足 泵 引 理 ; 因此 ，L 不 是 上 下 文 无 关 的 。 口 

例 7.4.2 语言 L= |alal|ij>=0l 不 是 上 下 文 无 关 的 。 设 上 是 泵 引 理 中 指定 的 数 是 z = 
a b'a^b' , (BEBETETE z 的 一 个 分 解 wwxy， 该 分 解 满足 泵 引 理 。 条 件 Gi) 要 求 wwx KERZE k, 这 
表明 vwx 是 一 个 只 包含 一 种 终结 符 的 串 或 者 两 个 这 样 的 串 的 连接 。 即 

i) vwwxea' x vwxeb', 或 者 

ii) vwxea'b':X vwxeb'a* 
根据 类 似 例 7.4. 1 中 的 讨论 ， FE v 和 x 必须 只 包含 一 种 终结 符 。 泵 作用 v 和 x， 将 只 在 z 的 一 个 子 串 
中 增加 a 或 者 b 的 数目 。 因 此 z 不 存在 满足 泵 引 理 条 件 的 分 解 ， 于 是 我 们 得 出 结论 ，L 不 是 上 下 文 无 
关 的 。 口 
例 7.4.3 语言 L=|wea” |length(w) 是 素数 | 不 是 上 下 文 无 关 的 。 假 设 工 是 上 下 文 无 关 的 ，n 是 
大 于 的 素数 ,是 定理 7.4.3 中 的 常数 。 串 a" 必须 具有 一 个 满足 泵 引 理 条 件 的 分 解 wwxy。 设 m = 
length(u) + length(w) + length(y) , IERS uv'wx'y WEBER m+i(n-m), 

特别 地 ，length(wy”* wx y) =m+(n+1)(n-m) =n(n-m+1)。 在 前 面 的 积 中 的 两 个 项 ， 
都 是 大 于 1 MARR. Alt, uv"* wx" y 的 长 度 不 是 素数 ， 该 串 不 在 工 中 。 所 以 , 工 不 是 上 下 文 无 
关 的 。 口 
7.5 上 下 文 无 关 语 言 的 封闭 性 

我 们 利用 上 下 文 无 关 文法 的 适应 性 来 确定 上 下 文 无 关 语言 集 的 封闭 结果 。 保 持 上 下 文 无 关 语 言 
操作 提供 了 另 一 个 证 明 语言 是 上 下 文 无 关 的 工具 。 这 些 操 作 ， 与 前 面 的 泵 引 理 结合 ， 也 可 以 用 来 说 明 
某 些 语言 不 是 上 下 文 无 关 的 。 

3E38 7.5.1 上 下 文 无 关 语言 族 在 并 、 连 接 和 克 林 星 (Kleene star) 操作 下 是 封闭 的 。 

证 明 : BEL, ALL, 是 分 别 由 G = (V, , EPS) AG, 2 (V,, X4, 5,5) PEM LE PERE, 
假设 变量 的 集合 V 和 V, 是 不 相交 的 。 由 于 我 们 可 以 改变 变量 的 名 字 ， 因 此 该 假设 没有 对 文法 增加 任 
何 的 约束 。 

从 G, 和 G, 构造 一 个 上 下 文 无 关 文 法 来 证 明 要 求 的 封闭 性 。 

并 : EX Gz(V, UV UIS} ,2 UP, U | SS, IS, | io 串 w 在 L(G) 中 ， YHN 
在 推导 SSS cw, =1 R2 BRU w fe L, 或 者 Ls 中 。 另 一 方面 ， 任 何 推导 Sw 在 G HEREA S 
S, 开始 产生 串 wo 

连接 ; EX G-(V,UVUISI, ZEUX,,P,UBUISSS S] ,S)。 开 始 符号 在 G 和 G, 中 都 初始 
化 了 接收 w 的 推导 。 在 G 中 的 一 个 终结 符号 串 的 最 左 推 导 具 有 So S,5, S uS, Suv 的 形式 ， 其 中 ue 
Li, vel,. u 的 推导 利用 P, 中 的 规则 ，y 的 推导 利用 P, 中 的 规则 。 所 以 L(G) CLL. HR, wit 
观察 可 以 确定 ， 每 一 个 在 LL, 中 的 串 w 都 能 够 写成 ww， 其 中 weL,, veL, WF Siu RI S>, 5 
G 中 的 8 规则 ,在 G 中 可 以 产生 w。 

克 林 星 : HL G=(V,,D,,P,U{SS,S| A} ,5S)。G 中 的 5 规则 产生 任意 数目 的 S, 的 副本 。 每 一 
个 这 种 副本 依次 开始 LL 中 串 的 推导 。 连 接任 意 多 个 瑟 中 的 串 将 产生 Li 。 E 

定理 7. 5. 1 展示 了 上 下 文 无 关 语言 集 的 正 的 封闭 的 结果 。 可 以 给 一 个 简单 的 例子 说 明 上 下 文 无 关 
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语言 在 交 下 是 不 封闭 的 。 最 后 ， 我 们 结合 并 的 封闭 性 和 交 来 得 到 一 个 补 也 是 不 封闭 的 结果 。 

定理 7.5.2 上 下 文 无 关 语 言 在 交 和 补 下 是 不 封闭 的 。 

证 明 :。 交 : WEL, = fab | i,j>0} ML, -iabc|ijz0l.L, ML, BSH OG, AG, 产生 的 上 
下 文 无 关 语 言 。 


G,:S—BC G, :S—-AB 
B—aBb| X A—aA | X 
CeCi B—bBc | X 


L, AL, 的 交 是 集合 |a'b'c' | i20], BIT. 4. 1 知 该 集合 不 是 上 下 文 无 关 的 。 
补 : BEL, AIL, 是 任意 的 两 个 上 下 文 无 关 的 文法 。 如 果 上 下 文 无 关 语言 在 补 下 是 封闭 的 ， 那 么 由 定理 
1S, te 
La UL, 
也 是 上 下 文 无 关 的 。 根 据 德 摩根 定律 ，L =L, mL:。 这 表明 上 下 文 无 关 语 言 在 交 下 是 封闭 的 ， 这 与 第 1 
部 分 的 结果 相 了 矛盾 。 a 
第 6 章 的 练习 9 显示 了 正则 语言 和 上 下 文 无 关 语 言 的 交 不 是 正则 的 。 语 言 和 下 推 自 动机 的 对 应 关 
系 可 以 用 来 确定 正则 和 上 下 文 无 关 语言 的 交 的 正 的 封闭 性 。 
设 R 是 被 DFA N 接收 的 正则 语言 , 工 是 被 PDA M 接收 的 上 下 文 无 关 语言 。 我 们 将 说 明 RNL 是 
上 下 文 无 关 的 ,方法 是 用 一 个 模拟 N 和 M 的 操作 的 PDA 来 构造 该 语言 。 复 合 自动 机 的 状态 是 由 M 和 
N 的 状态 组 成 的 有 序 对 。 
定理 7.5.3 设 R 是 正则 语言 ，L 是 上 下 文 无 关 语 言 。 语 言 RNL 是 上 下 文 无 关 的 。 
证 明 : 设 N=(Qy, Enn, go Fu) EFR R hY DFA, TiM = (Qu, Zm, Iôn, go, Fu) EE L 
的 PDA。 自 动机 N 和 M 相 结合 构成 PDA 
M'= (Qu xQN, Z4U DY De yy TE A 
它 接收 RNAL。M' 的 转换 函数 定义 为 “同时 运行 自动 机 M 和 N”。 有 序 对 的 第 一 个 部 分 是 M 进入 的 状 
态 序列 ， 第 二 部 分 是 N 进入 的 状态 序列 。 转 换 函 数 M' 定 义 为 
i) 6([p,q],a,A)="{[[p’,g'];B]|[p’,B] e84(p,a,A) IFA 8,14,a) =q'} 
ii) 8([p,4],N,A) = 1EEp',a1,8] | [p',B] €8,(p,X,A)! 
DFA 的 每 一 个 转换 处 理 一 个 输入 符号 ， 然 而 PDA 的 有 些 转 换 并 不 处 理 输入 。 条 件 〈ii) 引入 的 转换 
模拟 了 PDA 不 处 理 输入 符号 的 转换 的 动作 。 
E w 被 M' 接 收 ， 如 果 存 在 计算 : 
[ipg] w, A] E [Lpg]; NA] 
Hep, p; lg, HE M AN 的 终止 状态 。 
"ffi L(N) aL(M) SL(M')， 因 为 存在 下 面 的 计算 
[Epo,4o],w,X] 应 [ [pi,q; ju,a] 
只 要 
[po ,w,X] trl p,,u,a]ItA [qo,w] klau] 
E M 和 NN 中 的 计算 。 证 明 可 以 通过 对 PDA M 上 的 转换 数 进行 归纳 。 
递归 的 基础 是 M 中 的 空 计算 。 计 算 终 止 时 ,p; =po, u=w 并且 M 含有 一 个 空 栈 。N 中 以 原 串 终 
止 的 惟一 的 计算 是 空 计算 ; 所 以 9 = qo。 在 复合 机 器 中 ， 相 对 应 的 计算 是 M' 中 的 空 计算 。 
假设 对 于 M' 中 所 有 长 度 为 i'n 的 计算 结果 都 成 立 。 设 
[po wA] Lal [pu a] H. [ qo,w] h-[4,,u] 
分 别 是 PDA Al DFA 中 的 计算 。M 中 的 计算 可 以 写 为 : 
[Po wir] 
E [pi,v,B] 
p [Pi u,a] 
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其 中 ，v=& 或 者 v= ax。 为 了 展示 存在 计算 [[ps gol w,X] 应 [[Pg] u,a], FESI v 的 每 一 
种 可 能 情况 。 
情况 1: v=u。 在 这 种 情况 中 ，M 中 的 计算 的 最 终 转换 并 不 处 理 输入 符号 。M 中 的 计算 是 通过 形 
式 为 [p;,B] e 6y (pi ,和 ,A4) 的 转换 完成 的 。 这 个 转换 在 M' 中 产生 [ [p,q;],B] e6([p,,g,],N,A)s。 计算 : 
[ [po 540] w,X] Elpa], vB] 
he [[p,,4;] v.a] 
可 以 从 归纳 假设 和 M' 中 前 面 的 转换 获得 。 
情况 2: v=au。N 中 将 w 规约 到 的 计算 可 以 写 为 : 
[go,w] 
hr [q.v] 
br [a,u] 


其 中 ,最 后 一 步 应 用 转换 6\ (Gn ,a) = qj。 es 2 DEA Ri PDA XP AA MORET LAE 中 的 转换 
[Lpi,q,],B] e6([pi,4,],a,A)。 将 这 个 转换 应 用 到 计算 的 结果 ,根据 归纳 假设 可 以 得 到 
[ [po,go],w,N] br [Pesda] ,YB] 
ber [ [P;.4;] ,u,a] 
男 一 方面 , LCM’) SLCN)nLCM) 可 以 通过 对 M' 中 计算 的 长 度 进 行 归纳 而 得 证 。 证 明 将 留 做 
练习 。 m 
定理 7. 5. 2 使 用 了 德 摩根 定律 说 明了 上 下 文 无 关 语言 在 补 下 是 不 封闭 的 。 下 面 的 例子 给 出 一 个 清 
楚 展 示 这 个 性 质 的 文法 。 
例 7.5.1 语言 L= {ww| we {a,b} “| 不 是 上 下 文 无 关 的 ; 但 工 是 上 下文 无 关 的 a 首先， 我 们 将 
通过 反正 法 来 说 明 工 不 是 上 下 文 无 关 的 。 假 设 工 是 上 下 文 无 关 的 。 那么， 由 定理 7. 5.3 
Lna'b'a'b' =|abab |i,j>0| 
是 上 下 文 无 关 的 。 然 而 ， 在 例 7.4.2 中 已 经 证 明了 该 语言 不 是 上 下 文 无 关 的 ， 与 我 们 的 假设 矛盾 。 
为 了 说 明 L 是 上 下 文 无 关 的 ,需要 构造 两 个 上 下 文 无 关 文 法 G, AG, 使 得 L(G,)UL(G,) =L, 


G, :$—aA | bA |a| b G, :SAB | BA 
A-»as | bS A—ZAZ | a 
B—ZBZ|b 

Za|b 


文法 G, 产生 (la, b} 上 的 长 度 为 奇数 的 串 ， 所 有 这 些 串 都 在 L 中 。G, 产生 工 中 的 长 度 为 偶数 的 
串 。 这 样 的 串 可 以 写成 wxviwyv,， 其 中 x, ye XJfH xy, u, vi u AR v, e X` ,length(u,) = 
length( u, ) H. length(v,) =length(v,)。 即 ,x 和 y 是 出 现在 子 串 中 相同 位 置 的 不 同 的 符号 ， 这 个 子 串 分 
别 组 成 了 ux uyv 的 前 半 部 分 和 后 半 部 分 。 因 为 w 和 vw 是 任意 的 串 ， 所 以 这 个 性 质 可 以 写成 
wxpqyv，， 其 中 length(p) =length(u,), length(q) =length(v,)。G, 中 的 递归 变量 产生 的 恰好 是 这 些 串 


的 集合 。 口 
7.6 练习 
1. it M 是 PDA， 其 定义 如 下 
Q= 14059192 | 6( qo 54,X) ={Lq Al} 
x = {a,b} Elgo A,A) =| [qt 入 ]} 
z [A] 6( 95554) 2 1[a5, X1] 
F={q a} 6(q,,,A) = {lg ,入 ]|} 


6( q ,b,A) 一 | [ 4 a] | 
6( gq; ,入 ,A) = | [a Al} 
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a) 描述 M 接收 的 语言 。 
b) 给 出 M 的 状态 图 。 
c) 跟踪 M 对 串 aab, abb 和 aba 的 所 有 计算 。 
d) 说 明 aabb, aabb e L( M), 
iz M 是 例 7.1.3 中 的 PDA 
a) 给 出 M 的 转换 表 。 
b) 跟踪 M 对 ab, abb 和 abbb 的 所 有 计算 。 
c) 说 明 aaaa, baabeL(M)。 
d) 说 明 aaa, ab¢L(M). 
. 构造 接收 下 面 的 每 一 个 语言 的 自动 机 

a) [a'b | O&isjl 

b) ladb | i,j=0} 

c) la'Pc* | i+k=j} 

d) {w| we la,b] * ,w 中 a 的 数目 是 b 的 两 倍 | 

e) la'b | i20] Ua* Ub* 

f) (aB | ij &j - k| 

g) [a'b | iz jl 

h) [a'b | 0<i<j<2i} 

i) fabe | i,j >0} 

j) {a,b} 上 的 回 文 串 的 集合 。 
4. 构造 一 个 接收 下 面 语言 的 只 含有 两 个 栈 元 素 的 PDA 

wdw* | we (a,b,cl* | 

5. PDA Z: ilicis La p | O<j<i}, 给 出 其 状态 图 ， 并 解释 栈 符号 在 M 的 计算 中 的 作用 。 跟 踪 M 对 

输入 aabb 和 aaaabb 的 计算 。 
6. 自动 机 M 


t2 


Ww 


a MA b AIN 


终结 状态 空 栈 接收 语言 [a'b' | i20]. 
a) 给 出 空 栈 接收 LL 的 PDA 的 状态 图 。 b 
b) 给 出 终结 状态 接收 工 的 PDA 的 状态 图 。 
7. LEHA wela, b)" |w 有 这 样 一 个 前 级 ， 该 前 缀 之 中 心 的 个 数 多 于 a 的 个 ' 

数 | 。 例 如 baa, abba, abbaaaeL, 但 是 aab, aabbab ¢ L 

a) 构造 一 个 终结 状态 接收 工 的 PDA。 

b) 构造 一 个 空 栈 接收 蕊 的 PDA。 
8. 设 M=(Q, 工 , 工 ,5， 4 F) SE BAAS FS RAE BCL 的 PDA。 证 明 存 在 一 个 只 被 终结 状态 接收 工 

的 PDA, 
9. 设 M=(Q, 二 ,T,5,qg,E) 是 被 终结 状态 和 空 栈 接收 工 的 PDA。- 证 明 存 在 一 个 只 被 空 栈 接收 工 ff) PDA, 
10. iE L= { 必 大 | iz0| 

a) 构造 一 个 PDA M,, (#44 L(M,) =L. 

b) 构造 一 个 原子 PDA M,, 使 得 L(M,) =L, 

c) 构造 一 个 扩展 PDA M,, (7 L(M,) =L， 并 且 它 比 Mi 具有 较 少 的 状态 。 

d) 跟踪 (a)、(b) 和 (c) 中 自动 机 对 输入 aab 的 计算 。 
11. i$ L= (a? p" | iz0| 

a) 构造 一 个 PDA M ， 使 得 L(M ) =L。 

b) 构造 一 个 原子 PDA M,, 使 得 L(M, ) =L, 

c) 构造 一 个 扩展 PDA M,, [84$ L(M,) =L, HECH M, 具有 较 少 的 状态 s 

d) 跟踪 (a). (b) fü (c) 中 自动 机 对 输入 aabbb 的 计算 。 
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12: 


13. 


14. 


17. 


18. 


19. 


20. 


21. 


522. 
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利用 定理 7. 3. 1 中 的 方法 构造 一 个 接收 下 面 格 立 巴赫 范式 文法 的 语言 的 PDA。 

S—aABA | aBB 

A—bA | b 

B—cB|c 
设 G 是 格 立 巴 赫 范 式 文法 ，M 是 从 G 中 构造 的 PDA。 证 明 如 果 M 中 具有 转换 [ g, u,n] P [3 Àw], 
那么 G 中 存在 推导 S ww。 这 完成 了 定理 7. 3. 1 的 证 明 。 


设 M 是 PDA 
Q= 1405954 8(4,,a,X) = 1[4,,A]] 
X - {a,b} 8(q,,b,A) =1[4,,]] 
T={A} 8(q,,b,X) ={[%,A]] 
F= {9g,| 6(q,,b,A) = |[gi,N]! 


a) 给 出 M 的 状态 图 。 

b) 给 出 L(M) 的 集合 的 定义 。 

c) 使 用 定理 7. 3.2， 构 造 一 个 产生 L(M) 的 上 下 文 无 关 文法 G, 
d) 跟踪 M 中 对 aabbbb 的 计算 。 

e) 给 出 G 中 aabbbb 的 推导 。 


. 设 M 是 例 7.1.1 中 的 PDA 


a) 跟踪 M 中 接收 bbcbb 的 计算 。 
b) 利用 定理 7. 3. 2 的 计算 ， 构 造 一 个 接收 L(MD) 的 文法 G。 
c) 给 出 G 中 bbcbb 的 推导 。 


. 定理 7.3.2 给 出 了 构造 产生 扩展 PDA 接收 的 语言 的 文法 的 方法 。PDA 的 转换 最 多 将 两 个 变量 压 人 栈 中 。 


推广 从 任意 的 扩展 PDA 构造 文法 的 过 程 。 证 明 得 到 的 文法 能 够 产生 PDA 接收 的 语言 。 
使 用 泵 引 理 证 明 下 面 的 各 个 语言 不 是 上 下 文 无 关 的 。 
a) da | 是 完全 平方 数 } 
b) la'ibic'd |i, j=0} 
c) Na'b’a’' | i=0} 
d) {a'bic!|0<i<j<k<zi} 
e) Iww"w| we la,b] "| 
f) 无 穷 串 的 有 限 长 度 的 前 缀 构成 的 集合 
abaabaaabaaaab:-- ba" ba" *! b... 

a) 证 明 语言 L = {a'b”c |i, j20| 是 上 下 文 无 关 的 。 
b) 证 明 语言 L, = |a b/c" |i, j20] 是 二 下文 无 关 的 : 
c) 证 明 L, AL, 不 是 上 下 文 无 关 的 。 
a) HER L = [a/b/cd |i, j20] 是 上 下 文 无 关 的 。 
b) EHER L, = la b'c'd* |i, j, k20) 是 上 下 文 无 关 的 。 
c) ŒH L, AL, 不 是 上 下 文 无 关 的 。 
设 工 是 1a, b} 上 的 所 有 a 和 4 数目 相同 的 串 构 成 的 语言 。 说 明江 满足 泵 引 理 。 即 ;说 明 每 一 个 长 度 
大 于 等 于 kk 的 串 z， 都 存在 一 个 满足 泵 引 理 的 分 解 。 
it M Æ PDA, 证明 存 在 一 个 决定 下 面 是 否 正 确 的 计算 过 程 : 
a) L(M) 是 空 。 
b) L(M) 是 有 限 的 。 
c) L(M) 是 无 限 的 。 
. 文法 G =(V,,P,5) 称 作 是 线性 的 (linear)， 如 果 G 中 每 一 个 规则 都 具有 下 面 的 形式 ; 

Au 

A—uBv 


23. 


24. 


25. 
26. 


mike 


"28. 


29. 


30. 
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其 中 u, ve 二， 并 且 4，BesV。 如 果 产 生 语 言 的 文法 是 线性 的 ， 那 么 该 语言 称 作 是 线性 的 。 证 明 下 
面 对 线性 语言 的 泵 引 理 。 

设 工 是 线性 语言 。 那 么 存在 一 个 常数 上， 对 所 有 的 zsL 有 length(z) 2k, z 可 以 写成 z=uvwxy， 并 且 满 
足下 面条 件 

i) length(uvxy) <k, 

ii) length(vx) »0, 3H. 

ii) uv'wxy eL, iz0, 

a) 构造 一 个 接收 fa, b} 上 的 含 奇数 个 a 的 串 的 DFA N, 

b) 构造 一 个 接收 [a"b | iz0] 的 PDA M, 

c) 利用 定理 7.5. 3 中 的 方法 构造 一 个 接收 L(N) NL(M) RS PDA M’, 

d) 跟踪 N、M 和 M“ 中 接收 aaab 的 计算 。 


设 G=(V, 工 ,P,8$) 是 上 下 文 无 关 的 文法 。 定 义 一 个 扩展 PDA M 
Q= 1a Elgo, A,A) = 1[4,,8]1 
Y -Xs 5(q 入 MA) = {[go,w] | A>weP} 
T2ESUV — 8(q,a4,0)-l|[qA]l ae X1 
F- lal 


WEB] L(M) =L(G), 

完成 定理 7.5.3 的 证 明 。 250 
证 明 上 下 文 无 关 语 言 集 在 逆转 运算 下 是 封闭 的 。 

设 工 是 并 上 的 上 下 文 无 关 语言 ，ae Lo. ENX er, (L) AKL 中 的 串 内 出 现 的 a 都 删除 后 所 获得 的 串 的 集 
fr. WA er, CL) EM L 中 删除 a 所 得 到 的 语言 。 例 如 ， 如 果 abab, bach 和 aa eL, 那么 bb. bcb 和 
和 Neer,(L)。 证明 er,(L) 是 上 下 文 无 关 的 。 提 示 : KE L 的 文法 转化 为 产生 er (CL) 的 文法 。 

在 练习 6. 19 中 已 经 引入 了 串 同 态 的 记号 。 设 工 是 二 上 的 上 下 文 无 基文 法 ， h: "一 了 “是 一 个 同 态 。 
a) WEB] ACL) = |h(w) | weL} 是 上 下 文 无 关 的 ， 也 就 是 说 ， 上 下 文 无 关 语 言 在 同 态 操作 下 是 封闭 的 。 
b) 利用 (a) 的 结果 说 明 er,(L) 是 上 下 文 无 关 的 。 

c) 给 出 一 个 例子 说 明 一 个 非 上 下 文 无 关 语 言 的 同 态 象 可 能 是 上 下 文 无 关 的 语言 。 

Bh: "一 了 “是 一 个 同 态 , 工 是 并 上 的 上 下 文 无 关 语言 。 证 明 {|w| hw) eL1 是 上 下 文 无 关 的 。 换 言 
之 ， 上 下 文 无 关 语言 族 在 逆 同 态 象 作用 下 是 封闭 的 。 

使 用 同 态 象 和 逆 同 态 象 说 明 下 面 的 语言 不 是 上 下 文 无 关 的 。 

a) la'bic'd | i,j>0} 

b) la'b?c* | iz0| 

c) {(ab)' (bc) (ca)! | iz0| 


参考 文献 注释 


下 推 自动 机 在 Oettinger [1961] 中 引入 。Fischer [1963] 和 Schutzenberger [1963] 中 研究 了 确定 


型 下 推 自动 机 ，Knuth [1995] 中 研究 了 接收 LR (k) 文法 产 成 的 语言 的 确定 型 下 推 自 动机 。Chomsky 
[1962], Evey [1963] 和 Schutzenberger [1963] 发 现 了 上 下 文 无 关 语言 和 下 推 自动 机 之 间 的 关系 。 
7.5 节 中 的 上 下 文 无 关 语 言 的 闭 包 性 来 自 Bar- Hillel, Perles 和 Shamir [1961] 以 及 Scheinberg 
[1960]。 练 习 28 和 练习 29 的 解答 可 以 在 Ginsburg 和 Rose [1963b] 中 找到 。 


上 下 文 无 关 语言 的 桶 引 理 来 自 Bar-Hillel、Perles 和 Shamir [1961]。Ogden [1968] 中 给 出 了 一 个 |251 


更 老 版 本 的 泵 引 理 。Parikh [1966] 的 理论 提供 了 证 明 不 是 上 下 文 无 关 语言 的 另 一 个 工具 。 252 
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第 三 部 分 
可 计算 性 


我 们 现在 开始 了 解 算 法 的 计算 能 力 及 其 局 限 性 。 术 语 “ 有 效 过 程 ”被 用 来 描述 我 们 直觉 上 认为 是 
可 计算 的 过 程 。 一 个 “有 效 过 程 ”包括 了 一 个 指令 的 有 限 集合 以 及 相应 的 规格 说 明 书 。 此 规格 说 明 书 
基于 输入 ， 并 以 指令 的 执行 顺序 来 编排 。 指 令 的 执行 不 需要 执行 计算 的 机 器 或 者 人 有 多 么 的 聪明 或 者 
富有 创造 性 ， 它 实际 上 是 十 分 机 械 化 的 。 有 效 过 程 所 产生 的 计算 首先 需要 执行 有 限 数目 的 指令 ， 然 后 
终止 。 上 述 的 属性 简要 描述 如 下 : 有 效 过 程 是 一 个 确定 性 的 离散 过 程 ， 并 且 对 于 任何 可 能 的 输入 均 会 
停机 。 

英国 数学 家 阿兰 . 图 灵 于 1936 年 设计 了 一 系列 的 抽象 机 ， 并 将 这 些 抽象 机 用 于 执行 有 效 计算 。 
图 灵机 则 在 这 一 系列 能 力 逐 渐 增 强 的 抽象 计算 机 中 (包括 有 限 自动 机 以 及 下 推 自动 机 )， 迷 到 了 一 个 
顶峰 。 与 有 限 自 动机 类 似 ， 可 应 用 图 灵机 的 指令 是 由 机 器 当前 的 状态 以 及 正在 读 取 的 符号 来 决定 的 。 
但 是 图 灵机 也 许 会 多 次 读 取 其 输入 字符 串 ， 并 且 一 条 指令 也 有 可 能 将 信息 写 到 存储 器 上 。 图 灵机 执行 
多 次 读 及 写 操作 的 能 力 使 其 计算 能 力 得 以 增强 ， 从 而 为 现代 计算 机 提供 了 理论 模型 。 

于 1936 年 由 逻辑 学 家 阿兰 佐 ' 丘 奇 提出 的 丘 奇 一 图 灵 论 题 ; 曾 断 言 道 : 在 任意 的 算法 系统 中 的 
任何 有 效 计算 都 能 够 用 一 个 图 灵机 完成 。 丘 奇 一 图 灵 论 题 并 不 应 该 被 认为 是 给 算法 系统 下 定义 一 一 因 
为 算法 系统 仅 是 其 中 一 个 极端 狭隘 的 视角 ,实际 上 存在 着 许多 被 设计 来 执行 有 效 计算 的 系统 。 沈 且 ， 
谁 又 能 预测 出 将 来 还 会 发 展 出 什么 样 的 形式 主义 或 技术 呢 ? 丘 奇 一 图 灵 论 题 也 并 不 是 认为 其 他 系统 不 
执行 算法 的 计算 。 实 际 上 ， 这 个 论题 断言 了 在 任何 类 似 的 系统 中 执行 的 计算 都 能 够 通过 设计 一 个 相应 
的 图 灵机 来 完成 。 也 许 能 够 支持 乒 奇 一 图 灵 论 题 的 最 有 力 证 据 是 在 论题 提出 的 70 年 后 ， 没 有 任何 人 
发 现 一 个 反例 。 对 于 该 理论 的 表述 以 及 其 对 于 可 计算 性 的 含义 将 在 第 11 章 中 讨论 。 

通过 文法 生成 的 语言 ， 以 及 这 些 语 言 被 机 器 所 识别 ， 两 者 之 间 的 一 致 性 扩展 成 了 图 灵机 的 语言 。 
如 果 图 灵机 代表 了 字符 串 识别 机 器 的 极致 的 话 ， 那 么 其 相关 的 文法 被 认为 是 最 通用 的 字符 串 转 化 系统 
也 就 是 合理 的 了 。 这 实际 上 就 是 事实 ， 与 图 灵机 相对 应 的 文法 称 为 无 限制 文法 也 正 是 因为 对 于 其 规则 
的 应 用 形式 没有 任何 的 限制 。 为 了 建立 图 灵机 识别 以 及 无 限制 文法 生成 之 间 的 一 致 性 ， 我 们 将 会 展示 
能 够 使 用 无 限制 文法 的 推导 来 对 图 灵机 的 计算 进行 模拟 。 

既然 接受 了 丘 奇 一 图 灵 论 题 ， 那么 算法 问题 的 解决 的 范围 就 能 够 通过 图 灵机 的 计算 能 力 来 界定 。 
因此 ， 为 了 证 明 一 个 问题 没有 解 ， 仅 需要 证 明 不 存在 针对 该 问题 的 图 灵机 解决 方案 。 使 用 这 个 方法 ， 
我 们 可 以 了 解 到 ， 图 灵机 的 停机 问题 是 不 能 够 被 确定 的 。 也 就 是 说 ， 没 有 任何 的 算法 能 够 确定 ， 对 于 
任意 的 图 灵机 M 和 字符 串 w， 图 灵机 M 是 否 会 在 输入 字符 串 为 w 的 计算 中 停机 。 我 们 因此 可 以 缩减 
问题 从 而 来 确立 不 可 判定 性 ， 这 种 不 可 判定 性 主要 涉及 图 灵机 计算 结果 的 额外 问题 ， 或 者 使 用 文法 规 
则 的 推导 的 存在 性 ， 甚 至 上 下 文 无 关 语言 的 属性 。 
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第 8 章 灵 机 


图 灵机 ， 于 1936 年 由 阿兰 . 图 灵 提 出 ， 代 表 了 有 限 状 态 计算 自动 机 发 展 的 另外 一 个 阶段 。 提 出 
图 灵机 的 最 初 目的 ， 主 要 是 为 了 研究 有 效 计算 , 但 展示 出 了 与 现代 计算 机 普遍 相关 的 很 多 特点 。 XE 
不 奇怪 ， 图 灵机 提供 了 设计 以 及 开发 “程序 存储 ”计算 机 的 一 个 模型 。 通 过 一 系列 的 基本 操作 ， 图 灵 
机 能 够 访问 以 及 修改 任何 存储 位 置 的 数据 。 和 计算 机 的 不 同 之 处 在 于 : 图 灵机 为 了 完成 一 个 计算 ,在 
时 间 上 和 空间 上 没有 任何 限制 。 

丘 奇 一 图 灵 论 题 提出 了 这 样 一 个 论断 ， 任 何 有 效 过 程 均 能 被 一 个 适当 设计 的 图 灵机 实现 ， 这 将 会 
在 第 11 章 详细 讨论 。 下面 两 章 将 要 介绍 的 关于 图 灵机 体系 结构 的 变种 以 及 其 应 用 ， 揭 示 了 图 灵机 计 
算 上 的 健壮 性 以 及 多 功能 性 。 


8.1 标准 图 灵机 


图 灵机 是 这 样 一 种 有 限 状 态 机 ， 在 每 次 状态 转换 的 时 候 在 带 上 面 打 印 一 个 符号 。 带 头 可 以 双向 运 
Bh, 从 而 允许 图 灵机 能 够 按照 要 求 的 次 数 读 取 以 及 操作 输入 *。 图 灵机 的 结构 与 有 限 状态 自动 机 很 相 
像 ， 只 是 状态 转换 函数 具有 一 些 额 外 的 特性 。 

定义 8.1.1 ARM (turing machine) 是 一 个 五 元 组 M=(Q, 且 ,TT,6,qo),Q 是 状态 的 有 限 集合 ， 
I 是 一 个 称 为 “ 带 字母 表 ” 的 有 限 集 , 中 包含 了 一 个 特殊 的 符号 B 来 代表 空白 ， XNXT- (B 
的 一 个 子 集 ， 称 为 输入 字母 表 ,18 是 从 Q xT 到 QxEx IL, R) 的 部 分 函数 ， 称 为 转换 函数 ， FAK 
态 qo eQ 是 一 个 特殊 的 状态 ， 称 为 初始 状态 

图 灵机 的 带 有 一 个 左边 界 ， 并 且 能 够 向 右 无 限 扩展 。 带 上 的 位 置 则 由 自然 数 来 标识 ， 最 左边 的 位 
置 被 标记 为 0， 每 一 个 带 的 位 置 均 包含 着 带 字母 表 上 的 一 个 元 素 。 

任何 一 个 计算 的 初始 都 是 这 样 的 ， 机 器 的 状态 是 :4 ， 带 头 扫描 最 左 $31 2$ Uwe 
边 的 位 置 。 而 输入 的 则 是 对" 中 的 一 个 字符 串 ， 从 位 置 开始 写 在 带 上 。 [| lel^|^]a] | | = 
位 置 0 以 及 带 剩 余 的 部 分 都 是 空白 。 上 图 显示 了 有 着 abba 输入 的 图 灵机 
的 初始 构造 。 带 字母 表 提 供 了 一 些 额 外 的 符号 ;这 些 符 号 可 能 会 在 计算 A 
中 用 到 。 

转换 往往 包含 三 个 动作 : 更 改 状态 ， 在 带头 正在 读 的 方 格 中 写 人 一 个 符号 ， 然后 移动 带头 。 带 
头 的 移动 方向 由 这 个 转换 中 的 最 后 一 个 元 素 所 决定 ; 王 意 味 着 带头 往 左边 移动 ;而 R 则 意味 着 带头 
往 右 移动 。 图 灵机 现在 的 格局 以 及 状态 转换 8(q;,x) =[ 9q,,y,L] 共 同 产 生 了 新 
格局 。 

这 个 转换 将 图 灵机 的 状态 从 gq; 转换 到 了 4% ， 用 >y 替换 了 带 上 原来 的 符号 x， 
并 且 将 带头 向 左 移动 了 一 个 方 格 。 图 灵机 的 这 种 能 够 使 带头 向 两 个 方向 移动 ， 
以 及 其 处 理 空白 的 能 力 ， 使 得 进行 无 限 连 续 计 算 成 为 可 能 。 

当 遇 到 没有 定义 其 转换 的 状态 或 者 符号 对 的 时 候 ， 计 算 随 即 终止 。 而 某 个 
从 位 置 0 开始 的 转换 也 可 能 会 向 左 移动 ， 从 而 移出 带 的 边界 。 当 上 述 情 况 发 生 
的 时 候 ， 这 次 计算 会 被 称 为 不 正常 的 终结 (terminate abnormally) 。 当 我 们 说 某 
个 计算 终止 ， 我 们 往往 是 说 其 是 正常 终结 的 。 

在 定义 8. 1. 1 中 所 提 到 的 图 灵机 是 确定 型 的 ， 也 就 是 说 ， 最 多 每 一 个 转换 
与 每 一 个 状态 以 及 带 符号 的 组 合 一 一 对 应 。 单 带 确定 型 图 灵机 ， 若 具有 上 述 的 初始 条 件 ， 则 称 为 标准 
图 灵机 (standard turing machine) 。 最 初 的 两 个 例子 描述 了 如 何 使 用 图 灵机 来 操作 字符 串 。 在 使 用 图 灵 
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机 计算 开发 了 一 个 工具 之 后 ， 我 们 将 会 运用 图 灵机 来 接收 语言 以 及 计算 函数 。 
例 8.1.1 下 面 的 表格 代表 了 输入 字母 表 为 |a,b| 的 标准 图 灵机 转换 函数 : 





从 状态 qu 开始 的 转换 将 带头 移动 到 位 置 1 来 读 取 输 入 。 从 状态 a, 开始 的 转换 读 取 输入 字符 串 ， 然 后 
交换 了 符号 a 和 符号 5 的 位 置 。 从 状态 9 开始 的 转换 将 图 灵机 返回 到 了 初始 位 置 。 

图 灵机 也 能 够 使 用 一 个 状态 图 来 表示 。 转 换 函 数 6( qi,x) =[ qj,y,4d] ,de 1L,R| 被 表示 为 从 q; 到 
q; 的 一 条 标记 为 x/yd 的 弧 。 右 侧 的 状态 图 代表 了 在 上 面 的 abR aa L 
转换 表 中 所 定义 的 图 灵机 。 图 b/a R bho L 


图 灵机 的 格局 包含 了 状态 ， 带 以 及 带头 的 位 置 。 在 标 ee 
准 图 灵机 的 任意 一 步 计算 中 ， 带 仅 有 有 限 的 一 部 分 是 非 空 (9)— — — @) © 
白 符 号 。 一 个 格局 被 表示 成 为 ug vB, HH B AAAA 
置 均 是 空白 ,而 uv 则 是 从 带 的 左边 界 到 B 使 用 符号 所 表示 的 一 个 字符 串 。wv 中 也 可 能 存在 空白 ， 但 
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是 uv 中 包含 了 所 有 的 非 空白 的 部 分 。 符号 ugivB 表示 图 灵机 现在 的 状态 是 9;， 正 在 扫描 v 的 第 一 个 符 
号 ,而且 带 上 uvB 右边 的 部 分 全 部 都 是 空白 。 

图 灵机 的 格局 表示 能 够 用 来 跟踪 图 灵机 的 计算 。 符 号 uq vB bc xa; yB 表示 了 格局 xq,yB 能 够 通过 将 
ug, vB 经 过 一 个 单独 的 对 M 的 变换 来 获得 。 通 过 遵守 标准 的 约定 ，ugivB hcxq;yB 表明 了 xq;yB 能 够 通 
过 ugivB 经 过 有 限 个 (包括 零 个 ) 单独 变换 来 获得 。 当 没有 任何 歧义 的 时 候 ， 该 变换 中 代表 图 灵机 的 


. M 将 会 被 忽略 。 


在 例 8. 1. 1 中 的 图 灵机 将 输入 字符 串 中 的 a 和 4b 互相 交换 。 当 输入 字符 串 是 abab 的 时 候 ， 计 算 的 
具体 过 程 如 下 : 
qoBababB 


I-Bq,ababB 
I- Bbq,babB 
I-Bbaq,abB 
E-Bbabq,bB 
I- Bbabaq,B 
I- Bbabq,aB 
I- Bbaq;baB 
I-Bbq,abaB 
I-Bq, babaB 


|q, BbabaB 
例 8. 1. 1 中 的 图 灵机 一 共 扫 描 了 输入 字符 串 两 遍 。 第 一 遍 是 从 左 到 在 ， 在 这 个 过 程 中 交换 了 a 
5， 第 二 遍 从 右 到 左 ， 仅 仅 将 带头 返回 到 了 最 左边 的 带 位 置 。 下 一 个 例子 主要 给 大 家 展示 图 灵机 是 如 
何 通 过 计算 来 拷贝 一 个 字符 串 的 。 拷 贝 数据 的 能 力 在 很 多 的 算法 过 程 中 十 分 重要 。 当 需要 拷贝 的 时 
候 ， 该 图 灵机 能 够 根据 特定 问题 的 数据 类 型 来 进行 针对 性 的 修改 。 
例 8.1.2 名 为 COPY 的 图 灵机 ,输入 字母 表 是 |a,b| ,将 会 生成 输入 字符 串 的 拷贝 。 也 就 是 说 ， 
带 上 面 的 字符 串 为 BuB 的 图 灵机 ， 在 执行 了 拷贝 计算 之 后 ， 带 上 面 的 字符 串 将 会 是 BuBuB。 
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X/XR 
Y/YR 










a/aR a/aR 
b/bR b/bR 


a B/B R © 






X/aL 
Y/b L 


TEE, MORNE AAS IP, KENAR, HERES XR Y Wie T A 
符 串 已 经 被 拷贝 的 部 分 。 输 入 字符 串 中 的 第 一 个 没有 标记 的 符号 指出 弧 是 从 状态 9 开始 。 而 环 9 ， 
4», d, di, qi 则 将 出 现 的 a 用 XX 替换 ,并 上 且 在 生成 的 字符 串 中 增加 一 个 a。 与 此 类 似 ， 下 边 的 一 个 
Arx, 则 拷贝 了 一 个 bp, 并且 在 输入 字符 串 中 用 了 将 b 蔡 换 。 当 整个 字符 串 被 拷贝 完了 之 后 ， 由 状态 
q; 开始 的 转换 则 将 和 和 工分 别 再 替换 回 RI b, 并且 将 带头 返回 到 初始 的 位 置 。 口 


8.2 ”作为 语言 接收 器 的 图 灵机 


图 灵机 已 经 成 为 有 效 计算 的 范例 。 图 灵机 的 计算 主要 是 由 一 系列 的 基本 计算 组 成 ， 这 些 基 本 计算 
的 决定 因素 包括 机 器 现在 的 状态 ， 以 及 带头 正在 读 取 的 符号 。 在 前 一 节 中 构造 的 图 灵机 主要 用 来 描述 
图 灵机 计算 方面 的 种 种 特性 ,在 这 些 计算 中 需要 读 取 以 及 操作 带 上 的 符号 ， 但 是 并 没有 关于 计算 结果 
的 任何 解释 。 除 了 计算 函数 以 外 ， 图 灵机 同样 能 被 设计 成 一 个 接收 语言 的 机 器 。 计 算 的 结果 可 以 根据 
图 灵机 结束 的 状态 或 者 带 在 计算 结束 时 的 格局 来 定义 。 

本 节 我 们 将 图 灵机 看 成 一 个 语言 接收 器 ， 也 就 是 是 否 接收 或 者 拒绝 某 一 输入 字符 串 的 计算 。 初 始 
的 时 候 ， 是 否 接收 输入 字符 串 是 根据 计算 的 最 终 状 态 来 定义 的 。 这 与 有 限 状 态 自动 机 以 及 下 推 自 动机 
接收 字符 串 的 方式 类 似 。 但 是 与 有 限 状态 自动 机 以 及 下 推 自动 机 的 不 同 之 处 在 于 ， 图 灵机 并 不 需要 全 
部 读 完 输 入 字符 串 就 能 够 判断 是 否 可 以 接收 输 大 字符 串 。 增 加 了 终结 状态 的 图 灵机 是 一 个 六 元 组 (Q， 
,TT,6,qo,F)， 其 中 FCQ 是 终结 状态 的 集合 。 

定义 8.2.1 图 灵机 M=(Q, 玉 ,TT,6,4o,F)， 输入 字符 囊 ue D*, RM 计算 停止 在 终结 状态 ， 
则 说 此 字符 串 被 终结 状态 接收 ( accepted by final state) 。 如 果 一 个 计算 是 非 正常 结束 , 则 不 管 机 器 是 否 
停止 在 终结 状态 ,此 字符 串 都 被 拒绝 。M 所 能 够 接收 的 语言 , 称 为 L(M)， 用 来 表示 M 所 能 够 接收 所 
有 的 字符 串 。 

被 图 灵机 接收 的 语言 称 为 递归 可 枚 举 语言 (recursively enumerable language) 。 图 灵机 能 够 向 两 个 
方 问 移动 带头 以 及 其 能 够 处 理 空白 的 能 力 使 得 它 不 会 因为 某 个 特定 的 输入 而 停机 ， 因 而 图 灵机 的 计算 
结果 有 三 种 可 能 性 : 停机 并 接收 输入 字符 串 ， 停 机 并 拒绝 输入 字符 串 ， 或 永 不 停机 。 基 于 最 后 一 个 可 
能 性 来 说 ,， 若 图 灵机 M 接收 了 工 ， 则 可 以 说 其 识别 了 语言 L， 但 并 不 一 定 因为 输入 的 字符 串 而 停机 。 
图 灵机 M 计算 并 且 从 而 识别 语言 L， 但 对 于 不 属于 工 的 字符 串 却 没有 任何 的 答案 。 

某 种 语言 被 图 灵机 所 接收 ， 但 是 对 于 其 中 任何 的 字符 串 ， 图 灵机 最 后 都 会 停机 ， 则 说 这 种 语言 
递归 的 。 可 以 判定 某 个 字符 串 是 否 是 这 种 语言 的 成 员 ; 图 灵机 在 计算 后 是 否 停机 提供 了 检测 一 个 字符 
串 是 否 属于 该 语言 的 方法 。 这 种 类 型 的 图 灵机 有 时 被 说 成 是 能 够 决定 语言 的 图 灵机 。 可 递归 只 是 语言 
的 一 个 属性 ， 而 不 是 能 够 识别 该 语言 的 图 灵机 的 属性 。 某 一 种 语言 ， 可 能 会 有 多 个 图 灵机 能 够 接收 ， 
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有 些 可 能 对 于 任何 输入 均 会 停机 ， 而 有 一 些 却 不 一 定 。 但 如 果 存 在 一 个 能 够 对 于 所 有 的 输入 字符 串 均 
停机 的 图 灵机 ， 便 足以 说 明 可 以 判定 字符 串 是 否 属于 某 种 语言 ， 并 且 该 语言 是 一 种 递归 语言 。 
在 第 12 章 我 们 将 展示 一 些 能 够 被 图 灵机 所 识别 ， 但 是 却 不 能 够 被 判定 的 语言 。 因 而 断定 ， 递 归 
的 语言 是 递归 可 枚 举 语 言 的 真子 集 。 术 语 递 归 以 及 递归 可 枚 举 来 源 于 图 灵机 可 计算 性 的 功能 性 解释 ， 
这 点 将 在 第 13 章 详细 介绍 。 
例 8.2.1 图 灵机 M 
b/b R 


M: Xa) BIBR m ala R (e) ala R 


b/bR 
接收 语言 (aUb) "aa(aUb)"， 下 面 的 计算 
qoBaabbB 
= Bq,aabbB 
+ Baq,abbB 
| Baaq,bbB 
在 接收 字符 串 aabb 之 前 仅仅 检查 了 前 半 段 。 语 言 (aUzp)  aa(aUb) ”是 递归 的 ， 图 灵机 M 将 会 接收 
每 一 个 输入 的 字符 串 然后 停机 。 当 遇 到 子 串 aa 的 时 候 ， 计 算 成 功 地 结束 了 。 其 他 的 计算 则 会 在 读 输 
和 字符 串 右边 第 一 个 空白 的 时 候 停机 。 O 
$/8.2.2 语言 L= a'b'c |i>0} Ex, (下 图 ) 所 接收 ， 


XIX R 





alaL 
b/bL 
Y/YL 
ZZL 


带 符号 X、 了 和 Z 来 标记 a, b, Alc 从 而 来 判断 他 们 是 否 匹配 。 当 输入 的 字符 串 中 的 符号 全 部 被 
正确 地 转 成 了 带 符号 的 时 候 ， 整 个 计算 便 正确 地 结束 了 。 从 状态 q 到 gs 的 变换 也 接收 空 字符 串 。 
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.图 灵机 M 显示 了 工 是 递归 的 。 在 识别 工 中 的 字符 串 时 ， 计 算 停 止 在 M 为 qu 的 状态 。 对 于 那些 不 
RL 的 字符 串 ， 当 图 灵机 一 旦 发 现 其 不 匹配 &&c 的 模式 的 时 候 ， 就 会 停止 在 不 接收 的 状态 ， 比 如 
说 ， 若 输入 字符 串 为 ca， 则 M 会 在 状态 为 9% 的 时 候 停 机 ; 同 理 ， 输 入 字符 串 为 abb 的 时 候 ，M 会 在 
状态 9; 的 时 候 停机 。 口 


8.3 可 供 选择 接收 标准 


通过 定义 8.2. 1， 图 灵机 是 否 接收 字符 串 决 定 于 计算 停止 时 的 图 灵机 状态 。 在 这 部 分 中 ， 提 出 了 
定义 接收 的 一 些 可 供 选 择 的 方法 。 ; 

第 一 个 能 够 做 的 选择 是 通过 停机 来 定义 接收 。 在 这 样 的 图 灵机 中 ， 若 输入 某 字 符 串 ， 计 算 结 束 的 
时 候 图 灵机 停机 了 ， 这 就 说 明 该 字符 串 被 图 灵机 接收 了 。 而 使 得 机 器 非 正 常 停机 的 计算 则 说 明 字 符 串 
不 被 图 灵机 接收 。 当 通过 停机 来 确定 接收 的 时 候 ， 图 灵机 的 定义 是 一 个 五 元 组 (Q, E, r,s qg), EX 
里 ,终结 状态 对 于 确定 该 图 灵机 接收 的 语言 没有 任何 作用 ， 从 而 被 忽略 了 。 

定义 8.3.1 假设 图 灵机 M=(Q,,T,6,4o)， 若 图 灵机 M 对 于 输入 字符 串 ueX', i NES E 
常 终止 ， 则 说 明 该 字符 串 被 停机 方式 接收 (accepted by halting) 。 

被 设计 成 为 停机 方式 接收 的 图 灵机 主要 用 于 语言 的 识别 。 对 于 任何 不 属于 该 语言 的 字符 串 的 计算 
将 不 会 终止 。 定 义 8. 3.2 说 明了 任何 能 够 被 停机 方式 接收 的 语言 ， 同 样 能 够 被 终结 状态 接收 的 图 灵机 
所 识别 。 

定理 8.3.2 下 面 的 叙述 是 等 价 的 : 

i) 工 被 终结 状态 接收 的 图 灵机 所 接收 。 

i) 工 被 停机 方式 接收 的 图 灵机 所 接收 。 

WEBB: AA RHLM -(Q, E,D,0,q,) Fe T: Lo WIE BLM'2(Q,E,D,5,3,,Q), HPs 
一 个 状态 都 是 终止 状态 ， 一 定 能 够 终结 状态 接收 语言 工 。 

反之 , 着 图 灵机 M = (Q, ,TT,6,qo,F) 终 结 状态 接收 语言 L， 定 义 图 灵机 M' -(QUIgI, X,T, 
6' ,qo ) 停 机 接收 为 : 

i) Aelg, x) BAREL, M (qx) =6( gq;,x)。 
ii) 对 于 每 一 个 状态 ws Q -下 , 若 alq) REEL, ME (qx) 2 [q, x, R]o 
iii) XJ-F8—^* x eT, 6'(q,,x) 2 [q,,x, R]. 
在 图 灵机 M 中 和 M' 中 ， 接 收 字符 串 的 计算 是 完全 一 样 的 。 图 灵机 M 中 不 成 功 的 计算 可 能 终止 在 拒绝 
状态 ， 不 正常 终止 或 者 不 能 停止 。 若 图 灵机 M 中 的 不 成 功 计算 终止 ， 那 么 图 灵机 M' 中 的 计算 则 会 进 
和 人 状态 q. EARS 4. 后 ， 图 灵机 将 会 不 确定 地 向 右 移 动 。 图 灵机 M' 中 仅 有 的 停机 计算 就 是 那些 在 
图 灵机 M 中 在 接收 状态 停机 的 计算 。 因 而 L(M) =L(M')。 L-] 

例 8.3.1 将 例 8.2.1 中 的 图 灵机 更 改 成 为 通过 停机 接收 (aUb)"aa(aUb)"。 下 图 所 示 的 图 灵机 

就 是 根据 定理 8. 3. 2 构造 的 。 当 整个 字符 串 中 没有 直到 aa 的 时 候 ， 计 算 就 会 进入 状态 q。。 


bib R 





BSF AR X 151 








通过 删除 从 go Ea. q. 到 'q。， 以 及 标记 为 a/aR 和 b/bR 的 弧 ， 得 到 的 图 灵机 仍然 停机 接收 (aU5)* 
aa(aUb)', » } L1 

在 练习 7 中 ， 将 会 介绍 一 种 称 为 被 进入 方式 接收 (acceptance by entering) 的 接收 方式 。 在 这 种 方 
式 中 ， 图 灵机 使 用 了 终结 状态 ， 但 是 并 不 需要 终结 接收 运算 。 若 计算 中 曾经 到 达 了 终结 状态 ， 则 该 字 
符 串 就 会 被 接收 ， 而 进入 终结 状态 之 后 ， 剩 下 的 计算 则 与 是 否 接收 该 字符 串 无 关 。 与 停机 接收 一 样 ， 
任何 被 进入 接收 的 图 灵机 都 能 够 被 变形 为 接收 同一 语言 且 以 终结 状态 接收 的 图 灵机 。 

除非 另 有 说 明 ， 图 灵机 都 将 会 如 定义 8;2.1 一 样 ， 采 用 被 终结 状态 接收 。 其 他 设计 用 来 接收 同一 
种 语言 的 图 灵机 ， 与 标准 图 灵机 是 等 价 的 。 


8.4 多 道 图 灵机 


本 章 的 余下 部 分 主要 是 来 介绍 标准 图 灵机 模型 的 一 些 变 体 。 每 一 种 变 体 都 从 某 种 程度 上 增强 了 标 
准 图 灵机 的 性 能 。 我 们 证 明了 变 体 图 灵机 所 能 接收 的 语言 与 标准 图 灵机 能 够 接收 的 语言 是 完全 一 致 
的 。 另 外 还 有 的 一 些 图 灵机 的 变 体 将 会 出 现在 练习 题 中 。 

多 道 带 是 将 带 分 成 多 条 轨迹 的 带 。 多 道 带 中 的 一 个 位 置 包含 了 带 字母 表 中 的 n 个 符号 。 下 图 描述 
了 一 个 两 道 的 带 ， 并 且 带 头 正在 扫描 第 二 个 位 置 。 


图 灵机 读 取 整个 带 的 位 置 。 当 要 选择 正确 的 转换 时 ， 多 scit 
道 图 灵机 增加 了 需要 考虑 的 信息 量 。 两 道 图 灵机 中 的 一 个 带 E Ltt tft) 
位 置 用 有 序 对 [x,y] 来 表示 ， 其 中 x 是 第 一 道 的 符号 , 而 ?是 A 


第 二 道 的 符号 。 ch 

两 道 图 灵机 的 状态 、 输 入 字母 表 、 带 字母 表 以 及 初始 状态 | 
和 终止 状态 与 标准 图 灵机 均 没 有 什么 区 别 。 两 道 图 灵机 的 一 次 
状态 转换 需要 读 取 整个 带 位 置 ， 然 后 重 写 整个 带 位 置 。 两 道 图 灵机 的 一 个 状态 转换 可 以 这 样 表 示 : 
8 (4, [x,y]) =[®,[z,w] d], HP de {L,R}. 

两 道 图 灵机 的 输入 字符 串 被 第 一 道中 的 标准 输入 位 置 所 代替 ， 第 二 道中 的 所 有 位 置 被 初始 化 成 空 
白 。 多 道 图 灵机 中 使 用 的 是 被 终结 状态 接收 。 

定理 8.4.1 语言 工 能 够 被 两 道 图 灵机 接收 当 且 仅 当 该 语言 工 能 够 被 标准 图 灵机 接收 。 

证 明 : 显而易见 ， 如 果 语 言 工 能 够 被 一 个 标准 图 灵机 所 接收 ， 那 么 它 一 定 能 够 被 一 个 两 道 图 灵机 
所 接收 。 等 价 的 两 道 图 灵机 只 需要 简单 地 忽视 第 二 道 的 存在 即 可 。 

设 M=(Q, 有 ,TT,6,qo,F) 是 一 个 两 道 图 灵机 。 可 以 构造 一 个 单 道 图 灵机 ， 使 得 其 每 个 带 位 置 中 记 
录 的 信息 能 够 和 两 道 图 灵机 的 某 个 带 位 置 中 记录 的 信息 相 一 致 。 我 们 只 需要 将 两 道 图 录 机 中 任意 带 位 
置 的 信息 以 有 序 对 来 表示 即 可 完成 上 述 需 求 。 等 价 的 单 道 图 灵机 M' 的 带 字母 表 包 含 了 两 道 图 灵机 M 
的 带 信息 的 有 序 对 。 两 道 图 灵机 的 输入 由 第 二 项 为 空 的 有 序 对 组 成 。M 的 输入 符号 a 与 M' 的 有 序 对 
[a,B] 是 相同 的 。 接 收 L(M) 的 单 道 图 灵机 为 ; 

M’=(Q,>¥ x {B} ,FxT,ó',q,F) 
其 转换 方程 为 
6'(gqis[x,y]) =8lg [x,y])s E 


8.5 双向 图 灵机 


具有 双向 带 的 图 灵机 和 标准 图 灵机 的 模型 是 完全 等 同 的 ， 不 同 之 处 仅 在 于 双向 图 灵机 可 以 向 两 个 
方向 无 限 延 伸 。 由 于 双向 图 灵机 没有 左边 界 ， 所 以 输入 字符 串 可 以 放 到 带 的 任意 位 置 ， 而 其 余 的 带 位 
置 均 被 假定 为 空白 。 带 头 在 初始 化 的 时 候 紧 挨 着 输入 字符 串 的 左 端 。 双 向 图 灵机 的 主要 好 处 在 于 ， 图 
灵机 的 设计 者 根本 不 用 考虑 万 一 越过 带 左边 界 可 能 会 产生 的 麻烦 。 

具有 双向 带 的 双向 图 灵机 能 够 通过 在 输入 字符 串 的 左 端 增加 一 个 特殊 字符 来 代表 单 向 带 的 左边 
界 ， 从 而 能 够 构造 并 模拟 标准 图 灵机 的 动作 。 符 号 #， 一 般 不 在 图 灵机 的 带 字母 表 中 出 现 ， 往 往 用 来 
模拟 带 的 边界 。 与 标准 图 灵机 等 价 的 双向 图 灵机 在 计算 刚 开 始 的 时 候 ， 就 在 紧 挨 着 带头 初始 位 置 的 左 
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边 写 下 了 符号 #。 双 向 图 灵机 剩 下 的 计算 就 与 单 向 的 标准 图 灵机 的 计算 别 无 二 致 ， 除 非 单 向 图 灵机 的 
计算 遇 到 异常 情况 而 终止 。 当 单 向 图 灵机 的 计算 试图 越过 左边 界 时 ， 双 向 图 灵机 就 会 读 取 到 符号 #, 
从 而 进入 不 接收 的 状态 来 终止 计算 。 
标准 图 灵机 M 
ala R 
EP ala L ala L ala L 


M: T) © bib L BIBL BIBL BIBL 


用 来 描述 从 单 向 图 灵机 向 等 价 的 双向 图 灵机 的 转换 。 除 了 状态 go 之 外 ， 图 灵机 M 的 其 他 状态 均 是 接 
收 状 态 。 当 过 到 第 一 个 符号 5b 的 时 候 ,， 车 有 可 能 ， 带 头 将 向 左边 移动 四 个 位 置 。 是 否 接 收 该 输入 字符 
串 则 完全 由 带 的 边界 来 决定 。 无 论 任何 时 候 ， 只 要 图 灵机 M 的 带头 在 计算 的 时 候 试图 越过 左边 界 ， 
该 字符 串 就 会 被 拒绝 接收 。 若 所 有 的 计算 都 发 生 在 带 的 边界 之 内 的 话 ， 则 该 字符 串 被 接收 。 因 而 图 灵 
机 M 的 语言 包含 了 所 有 在 1a,b| 这样 的 字符 串 ， 若 该 串 中 有 上， 则 第 1 个 b 之 前 至 少 有 3 个 a。 

带 有 双向 带 的 双向 图 灵机 M' 也 能 够 通过 在 标准 图 灵机 M 之 上 增加 三 个 状态 q,、g, 和 gq. 来 得 到 。 
从 状态 9, 到 状态 9, 的 转换 会 在 接收 L(M) 的 双向 图 灵机 M' 的 带头 的 初始 位 置 的 左边 添加 一 个 模拟 的 终 
端 标记 。 写 下 这 个 模拟 的 边界 之 后 ， 其 余 的 计算 就 和 标准 图 灵机 M 完全 一 致 了 。 当 标准 图 灵机 M 的 
计算 试图 越过 左边 界 的 时 候 ，M' 就 进入 4. 状 态 。 





接收 。 这 个 证 明 使 用 了 定理 
8. 4. 1， 此 定理 建立 了 双向 图 灵机 与 标准 图 灵机 之 间 的 可 互相 定义 的 性 质 。 双 向 带 的 带 位 置 能 够 使 用 
整数 的 全 集 来 进行 编号 。 带 头 的 初始 位 置 被 标号 为 0 输入 字符 串 则 是 从 位 置 1 开始 。 
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想像 一 下 ， 将 双向 无 穷 的 带 折 芭 起 来 ， 从 而 使 得 位 置 i 恰好 在 位 置 -i 的 上 面 ， 然 后 在 位 置 0 上 方 
增加 一 个 没有 被 标号 的 带 位 置 ， 则 直接 生成 了 一 个 双向 带 。 双 向 带 中 带 位 置 i 中 的 符号 直接 存储 在 单 
向 、 两 道 的 带 中 的 相应 位 置 。 那 么 ， 在 双向 无 穷 带 上 的 计算 能 够 在 单 向 、 stat ag? he WE 
两 道 的 带 上 面 模拟 。 

设 M=(Q,Z,T,5,%,E) 是 有 着 双向 带 的 图 灵机 。 通 过 使 用 上 述 的 
双向 带 与 两 道 带 之 间 的 对 应 ,我 们 能 够 构造 一 个 可 以 接收 工 (M) 的 单 向 、 

两 道 的 图 灵机 M'。M 中 的 状态 转换 被 当前 的 状态 以 及 当前 扫描 的 字符 所 0 1 2 3 4 5 
限定 。 而 M'， 则 要 扫描 两 道 带 ， 并 在 每 一 个 带 位 置 读 取 两 个 符号 。M 的 

状态 中 还 包含 符号 U (上 面 的 ) 以 及 D (下 面 的 ) 从 而 指出 到 底 是 哪 一 | 9 | 

道 用 于 M' 状 态 的 转换 。 
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M' 是 由 图 灵机 M 以 及 符号 U 以 及 DD 来 构造 的 : 
Q'«(QUIa,, 4,1) x 1U,D| 
E'E 
T'=TU |#| 
F’={[9¢,,U],[4,,D]|9,eF| 
M' 的 初始 状态 是 [gq,,D]。 从 这 个 状态 进行 的 转换 是 在 最 左边 的 带 位 置 的 上 一 道 写 入 一 个 标记 #。 
从 [g,,D] 开 始 的 状态 转换 将 带头 返回 到 初始 的 位 置 ， 从 而 开始 对 图 灵机 M 的 模拟 。 在 余下 的 计 
算 部 分 ， 第 二 道 的 符号 # 用 来 指示 当 带 头 在 读 位 置 0 并 且 状 态 从 UV 2838] D 的 时 候 的 改变 。M' 的 状态 转 
换 的 定义 如 下 
1. 8'([4,,D],[B,B]) 2 [[a,, D], [ B, 8], R) 
2. XF&—T xer, 6'C[a,,D],[x,8B]) 2[[a5,D],[x,B],L] 
3. 对 于 每 一 个 ze - 1E delL,R|, RE 6(qi,x) =la y d ERROL M 的 一 个 状态 转换 ， 
MA 8'((9,,D],[x,z]) 2 [Lay D] Ly, z]. 4]. 
4. 对 于 每 一 个 xeT - [# UR de [L,R], RE 6(q,,x) 2 [q;,y.d] € BL M 的 一 个 状态 转换 ， 
BBA 6'C[q;,U].[z,.x]) 2 [[q,,U],[z,v],d'], Rd’ d 的 相反 方向 。 
5. RE 8(q,,x) = [gj,y,L] 是 图 灵机 M 的 状态 转换 ， 那么 6'([gq;,D],[x,#])=[[gq;,U],[y,#]， 
RIZ 
6. 只 要 8(q;,x) 2 [qj y, R ERRI M 的 状态 转换 ,那么 6'([g;,D],[x,#]) 8 [Eg D], [y,#], 
R]. 
7. AB 8(q;,x) 2 [gq;,y,R] 是 图 灵机 M 的 状态 转换 ， 那么 6'([ qi,U],[x,#]) =[1¢,,D],Ly.#), 
R]。 
8. 只 要 6(gq,,x) =[9g;,y,L] 是 图 灵机 M 的 状态 转换 ,那么 6'([g,,U],[x,#]) =[[gq,;U],[y,#]， 
R]。 
第 3 条 所 产生 的 状态 转换 模拟 了 图 灵机 M. 在 带头 的 开始 与 结束 位 置 均 为 正 整 数 的 状态 转换 情况 。 
在 模拟 中 ， 其 方法 主要 是 通过 操作 带 的 下 面 一 道 。 第 4 条 中 定义 的 状态 转换 仅仅 使 用 了 两 道 带 的 上 面 
一 道 ， 这 与 图 灵机 M 中 双向 无 穷 带 中 负数 所 在 位 置 的 状态 转换 相对 应 。 
剩 下 的 状态 转换 则 模拟 了 图 灵机 M 双向 带 上 从 位 置 0 开始 的 其 他 的 状态 转换 。 如 果 忽 略 状态 中 
的 符号 U 以 及 符号 D， 那 么 从 带 位 置 0 开始 的 状态 转换 由 第 1 道上 的 符号 来 确定 。 如 果 描 述 道 的 符号 
HD, 那么 状态 转换 由 第 5 条 以 及 第 6 条 来 定义 。 第 7 条 和 第 8 条 中 的 定义 主要 应 用 在 当前 的 状态 为 
Lg, UJ] 的 情况 。 
上 述 非 正式 的 描述 给 出 了 双向 图 灵机 以 及 单 向 图 灵机 是 等 同 的 证 据 。 
定理 8.5.1 语言 工 被 具有 双向 带 的 图 灵机 所 接收 ， 当 且 仅 当 标准 图 灵机 能 够 接收 语言 工 。 


8.6 多 带 图 灵机 


k- 带 图 灵机 有 个 带 并 有 上 个 独立 的 带头 。 多 带 图 灵机 的 状态 以 及 带 字 母 表 与 标准 图 灵机 的 完全 
一 致 。 图 灵机 并 发 地 读 丰 条 带 ， 但 是 仅仅 有 一 个 状态 。 它 通过 连接 一 个 控制 部 分 和 每 一 个 独立 的 带头 


来 描述 当前 的 状态 。 第 3 带 el 
状态 的 转换 由 当前 的 状态 以 及 每 一 个 带头 所 扫描 的 符号 来 决定 。 
多 带 图 灵机 的 状态 转换 有 可 能 : 
i) 改变 状态 ， 
ii) 在 每 一 个 带 上 面 写 一 个 符号 ， 
ii) 独立 地 改变 每 一 个 带头 的 位 置 。 
位 置 的 重新 确定 包括 将 当前 的 带头 向 左 移动 一 个 位 置 ， 向 右 移 动 一 
个 位 置 ， 或 停止 在 原来 的 位 置 。 两 带 图 灵机 的 状态 转换 ， 首 先 读 取 1 
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带 上 的 符号 x 以 及 2 带 上 的 符号 x， 然后 根据 状态 转换 函数 (a, x, 2.) = [gj;yi dyd ETRA 
He, HP x,y er JHE d,e |L,R,S}。 状 态 的 转换 使 得 图 灵机 在 i 带 上 写 人 符号 y,。 符 号 d, 确切 地 
指出 了 带头 i 的 移动 方向 : L 表 明 向 左 移动 ， 而 R 则 表明 了 向 右 移动 ，S 表明 带头 保持 静止 。 任 何 带 
头 试图 移动 超出 带 的 左边 界 将 会 使 得 整个 计算 异常 终止 。 

多 带 图 灵机 的 输入 字符 串 放 在 第 1 带 的 标准 位 置 上 ， 其 他 所 有 的 带 上 均 仅 有 空白 。 带 头 首先 扫描 
每 个 带 的 最 左边 的 位 置 。 多 带 图 灵机 的 状态 能 够 使 用 一 个 状态 图 来 描述 ， 其 中 每 一 条 弧 上 的 标签 详细 
说 明了 每 一 条 带 的 具体 动作 。 例 如 ，6( gi,x ,五 ) = [553i di ;yz,d;] 将 会 使 用 一 条 从 iq; 到 4 ， 标 记 为 
[x,/y, d, x7 y,d; | SIRE RS o 

多 带 图 灵机 的 两 个 优势 分 别 是 : E ra pn Nak 这 两 个 特性 
均 会 在 下 面 的 例子 中 有 所 介绍 。 

例 8.6.1 图 灵机 


[a/a R,B/a R] [ala R ,a/a L] 


[B/B R ,B/B R] x [b/b R,B/B L] > (5) B/B R ,B/B R 
Q) g GH 


接收 语言 1a ba! | i20] 。 输 入 字符 串 为 wpeu: 的 图 灵机 ;在 状态 q 的 时 候 ， 将 输入 字符 串 前 面 的 多 个 a 
拷贝 到 带 2 Eo Hir 1 读 取 b 的 时 候 ， 图 灵机 进入 状态 9 ， 然 后 比较 带 1 Eb SR a 与 拷贝 到 带 2 
上 的 a。 如 果 两 条 带 上 的 a 一样 多 ， 则 计算 终止 并 且 接 收 输入 字符 串 。 如 果 输 入 字符 串 中 没有 b， 则 
计算 终止 在 q, 状态 。 如 果 输 入 字符 串 中 有 多 个 b, 则 计算 终止 在 9 状态 。 如 果 输 入 字符 串 中 有 一 个 
b, 但 是 前 后 的 a 的 数量 不 等 ， 同 样 终止 在 g 状态 。 由 于 每 一 个 计算 都 能 够 终止 ， 图 灵机 M 提供 了 一 
个 方法 来 判断 输入 字符 串 是 不 是 | a ba! | i=01 的 一 员 ， 因 此 该 语言 也 是 递归 的 。 

标准 图 灵机 是 只 有 一 条 带 的 多 带 图 灵机 。 因 此 ,任何 一 个 递归 可 枚 举 语言 均 能 够 被 多 带 图 灵机 接 
收 。 下 面 ， 我 们 将 会 展示 两 带 图 灵机 的 计算 能 够 使 用 一 个 五 带 图 灵机 来 模拟 。 一 般 地 说 ， 任 何 一 个 能 
够 被 上 - 带 图 灵机 接收 的 语言 ， 一 定 能 够 被 2K+1 =- 道 图 灵机 接收 。 多 带 图 灵机 以 及 标准 图 灵机 接收 语 
言 的 等 价 性 使 得 我 们 能 够 做 出 下 面 的 结论 。 口 

定理 8.6.1 语言 工 被 多 带 图 灵机 接收 ， 当 且 仅 当 标 准 图 灵机 能 够 接收 语言 j 

设 M=(Q, 二 ,T,5,%,E) 是 一 个 两 带 图 灵机 ， 在 计算 的 过 程 中 ， et 


带 之 上 的 。 
多 道 图 录 机 的 单一 带头 一 次 读 取 固 定位 置 的 所 有 道上 的 数 rod FINIS 


据 。 下 面 的 五 道 图 灵机 M' 就 被 构造 用 来 模拟 两 带 图 灵机 M 的 计 
算 。1 道 和 3 道 保存 了 两 带 图 灵机 1 带 和 2 带 上 面 的 信息 ,2 道 与 
4 道 有 一 个 非 空 的 方 格 来 指出 多 带 图 灵机 的 两 个 带头 的 移动 方向 。 

多 道 图 灵机 模拟 过 程 的 第 一 个 动作 就 是 在 第 5 道 的 最 左边 位 
置 上 写 人 符号 #， 以 及 在 第 2 道 和 第 4 道 的 最 左边 位 置 上 写 人 符 
SX, 多 道 图 灵机 剩 下 的 计算 过 程 包括 了 一 系列 的 动作 ,从 而 来 
模拟 两 带 图 灵机 中 的 状态 转换 。 

两 带 图 灵机 中 的 状态 转换 主要 是 由 当前 带头 所 扫描 的 两 个 符 
号 ， 以 及 机 器 当前 的 状态 所 决定 的 。 而 五 道 图 灵机 的 模拟 中 则 是 
将 已 经 处 理 过 的 字符 用 XX 来 标注 ， 状 态 则 是 使 用 形 如 [ s,q; ,x ， 
No ya sl, ] 的 八 元 组 来 表示 ， 其 中 q; € Q;x,,y;e SUUE 
d,e |L,R,S, U} o FOR s RE TEM 中 状态 转换 模拟 的 状态 。 符 
号 以 被 添加 到 带 字母 表 以 及 方向 集合 中 ， 它 说 明了 当前 项 为 未 知 的 。 

Vt 6(q,,x, X) 2 14531 d, y, ,d; ] FET EL JL M. 的 一 个 可 用 的 状态 转换 。M' 模 拟 M 的 转换 的 初 
始 状 态 是 [ 岂 ,q;,U,U,U,U,U,U]， 下 面 的 几 个 步骤 在 多 道 图 灵机 中 模拟 了 两 带 图 灵机 M 的 状态 转换 : 
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1. fl (发 现 第 1 个 符号 ): M' 往 右 移动 ， 直 至 它 读 到 第 2 道上 的 X。 然 后 进入 状态 [有 1 4; x, ,U, 
U,U,U,U], 其 中 x 是 XX 下 面 的 第 1 道中 的 符号 。 当 在 这 个 状态 中 记录 了 第 1 道中 的 符号 时 ，M' 重 
新 返回 初始 位 置 。 第 5 道上 的 符号 # 用 来 标识 带头 。 

2. f2 (发现 第 2 个 符号 ): 同样 的 过 程 ， 从 而 能 够 记录 第 .4 道 的 和 X 符号 下 面 的 字符 。M' 进 入 状态 
[J2,4,,x, x, ,U,U,U,U], Kp x, 是 位 于 第 3 道 并 且 恰 好 在 和 符号 下 面 的 字符 ， 然 后 带头 再 次 返回 到 
初始 位 置 。 

3. M' 进 入 状态 [pl1 ,q; x, ;加 5 六 为 ;di ,d,], 其 中 qj、 Viv Y». 4, d, 均 从 状态 转换 (9; x, x) f8 
来 。 这 个 状态 包含 了 需要 用 来 模拟 M 的 信息 。 

4. pl (打印 第 1 个 字符 ): M' 往 右 移 动 直到 第 2 道 的 X 符 号 处 ， 然后 在 第 1 道上 面 写 人 符号 y。 
第 2 道上 的 符号 和 按照 d 所 指示 的 方向 移动 ， 然 后 机 器 返回 到 初始 位 置 。 

5. p2 (dTEI28 2 个 字符 ) : M' 往 右 移动 直到 第 4 道 的 和 符号 处 ， 然 后 在 第 3 道上 面 写 人 符号 m。 
第 4 道上 的 符号 X 按 照 d, 所 指示 的 方向 移动 。 

6. 状态 转换 5( 9, .%) 5) = aY diya d AIRM, 终止 于 将 带头 返回 到 初始 位 置 ， 然 后 进行 下 
一 步 的 状态 转换 。 

如 果 6( q, ,x x, ) 在 两 带 图 灵机 中 没有 被 定义 ， 那么 该 步骤 的 模拟 在 第 2 步 ， 即 带头 返回 到 初始 的 位 置 
后 停止 。 不 管 g; 是 不 是 两 带 图 灵机 M 的 接收 状态 ， 状 态 [及 ;gi ,x ,yi,U,U,U,U] 均 是 多 道 图 灵机 M* 
的 接收 状态 。 

下 面 的 两 个 例子 描述 了 使 用 多 条 带 来 存储 以 及 操作 计算 中 的 数据 。 

例 8.6.2 集合 ila"|k 是 一 个 完全 平方 数 | 是 一 个 递归 可 枚 举 语 言 。 下 图 所 示 就 是 可 接收 此 语言 
三 带 图 灵机 。 第 一 带 容纳 着 输入 字符 串 ， 输 入 字符 串 将 会 和 第 二 带 上 的 字符 串 进行 比较 。 第 二 带 上 是 
由 和 X 所 组 成 的 字符 串 ， 其 长 度 是 完全 平方 数 。 第 三 带 则 保存 着 一 个 字符 串 ， 其 长 度 是 第 二 带 上 字符 长 
度 的 平方 根 。 输 入 字符 串 为 aaaaa 的 计算 的 初始 结构 如 下 






RH 一 输入 中 


k VUR K 的 值 会 增加 ， 直 到 第 二 带 上 字符 串 的 长 度 比 输入 字符 串 长 或 相等 。 一 个 用 来 进行 这 种 比 
较 的 图 灵机 包括 了 下 面 的 动作 : 

1. 如 果 输 入 的 字符 串 是 空 字符 串 ， 则 图 灵机 的 计算 将 会 在 接收 状态 停止 。 若 输入 字符 串 不 为 空 ， 
则 第 二 带 和 第 三 带 将 会 被 初始 化 一 一 在 第 一 个 位 置 写 人 字符 于 ， 然 后 三 个 带头 移动 到 位 置 1。 

2. 第 三 带 现在 容纳 着 上 个 和 的 字符 串 ， 第 二 带 容纳 着 二 个 X。 第 一 带 和 第 二 带 的 带头 同时 向 右 移 
动 ， 并 且 两 个 带头 均 扫 描 非 空 的 方 格 。 第 三 带 的 带头 仍然 停留 在 位 置 1。 

a) 如 果 两 个 带头 同时 读 到 一 个 空白 ， 则 计算 停止 ， 并 且 该 字符 串 被 接收 。 

b) 如 果 第 一 带 的 带头 读 到 一 个 空白 ， 而 第 二 带 读 到 了 一 个 X， 则 计算 停止 ， 该 字符 串 被 拒绝 。 

3. 如 果 上 面 的 两 种 情况 都 不 发 生 ， 则 带 被 重新 设置 ， 然 后 开始 下 一 轮 的 比较 。 

a) 在 第 二 带 的 和 字符 串 的 右边 添加 一 个 X5 

b) 第 三 带 的 字符 串 被 拷贝 两 次 并 且 添 加 到 第 二 带 。 这 样 就 建立 了 第 二 带 上 的 (上 +1) 个 X 字 符 

串 的 序列 。 
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c) 在 第 三 带 的 X 符 号 串 的 右边 添加 一 个 XX， 这 样 就 建立 了 第 三 带 上 面 的 +1 个 和 字符 的 序列 。 
4. 计算 将 从 第 二 步 继续 往 下 进行 。 
当 输 入 字符 串 是 aaaaa 时 ， 我 们 一 步 一 步 地 跟踪 计算 过 程 。 第 一 步 产 生 的 状态 如 下 : 


mot st iada e eral Pol 





带头 1 以 及 带头 2 同时 向 右 移动 ， 当 带头 2 在 位 置 2 遇 到 空白 的 时 候 ， 带 头 1 和 带头 2 停止 。 


mee co pope el d shed ed 





272 第 三 步 的 (c) 部 分 重新 格式 化 了 第 二 带 和 第 三 带 ， 从 而 使 得 输入 字符 串 能 够 与 下 一 个 完全 平方 进 


行 比较 。 
wow —2 [| xx | | TT TT TL 





另外 一 个 第 二 步 的 循环 导致 的 停机 并 且 拒绝 输入 字符 申 。 
mms Od Co hoh] pih 
| dxIxIxIxIxIx[xTx[xT | 






第 2 带 —3 


第 1 带 一 输入 


进行 以 上 计算 的 图 灵机 可 以 由 如 下 的 状态 转换 来 定义 : 
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8(q,,B,B,B) 2[q,;B, R;B,R;B,R] (初始 化 带 ) 

8(q,,a,B,B) =[q,;a,8;X,S;X,S] 

5(q,,4,X,X) 2 [q,;a, 5X, RX,S] (比较 第 一 带 和 第 二 带 上 的 字符 串 ) 

8(q,,B,B,X) 2 [q,;B,S; B, S;X, S] (接收 字符 串 ) 

8(q,,a,B,X) 2 [q,5a,$; X, R,X,S] 

6(q,,a,B,X) =[ gs;a,S;X,R;X,S]( 重 写 第 二 带 和 第 三 带 ) 

8(4,,a,B,B) =[q6;a,L;B,L;X,L] 

6(gqs,a,B,X) =[ gs;a,S;X,R;X,R] 

6(q,,a,X,X) =[ qo;a,L;X,L;X,L]( 重 置 带头 ) 

6(qe,a,X,B) 2 [q,;a,L;X,L;B,S] 

8(4,,a,B,B) =[ ge;a,L;B,S;B,S] 

8(4,,B,X,B) 2 [q,;B, S; X, L;B,S] 

8(4,,B,B,B) =[ 4,;B,R;B,R;8B,R]( 重 新 开始 新 的 一 轮 的 比较 ) 
接收 状态 是 q 和 4 ， 空 字符 串 将 会 被 状态 9, 接收 ,字符 串 a‘ 则 会 被 状态 g 接收 ， 其 中 是 一 个 大 于 
零 的 完全 平方 数 。 

由 于 上 述 设计 的 图 灵机 能 够 对 于 所 有 的 输入 字符 串 停 机 ， 因 此 我 们 可 以 知道 语言 1a* | 是 一 个 完 
全 平方 数 } 不 仅仅 是 一 个 递归 可 枚 举 语言 ， 同 时 也 是 一 个 递归 语言 。 m 

例 8.6.3 两 带 图 灵机 


[x/x R,B/x R] 


[B/B R,B/B R] [B/B L,BIB L] [xx Lyly L] xe{a,b} 
ye{a,b,B} 





[x/x Lyly S] 


[B/B R,yly R] 


(4,) [x/x R,x/x R] 


[yly R,B/B R] 


接收 语言 {uu| ue {a,b} "| 。 在 弧 上 标注 的 符号 x 和 y 代表 了 任意 的 一 个 输入 字符 。 

此 图 灵机 的 计算 首先 拷贝 第 二 带 上 的 输入 字符 串 。 当 拷贝 结束 了 之 后 ， 两 个 带头 都 到 了 输入 字符 
串 的 最 右边 。 然 后 带头 重新 移 到 最 左边 ， 而 且 当 第 二 带头 每 移动 一 个 方 格 的 时 候 ， 第 一 带头 移动 两 个 
方 格 。 如 果 图 灵机 的 计算 在 q 停机 的 话 ， 则 输入 字符 串 有 长 度 为 奇数 ， 从 而 被 拒绝 ，4 中 的 循环 比 
较 了 输入 字符 串 的 前 半 部 分 和 后 半 部 分 ， 如 果 它 们 匹配 ， 则 此 字符 串 将 会 再 9 被 接收 。 口 


8.7 非 确定 型 图 灵机 


对 于 一 个 给 定 的 结构 ， 非 确定 型 图 灵机 将 会 指定 状态 转换 的 有 限 次 数 。 非 确定 型 图 灵机 的 组 成 部 
Tt, 除了 状态 转换 函数 以 外 ， 均 和 标准 图 灵机 完全 一 致 的 。 非 确定 型 图 灵机 的 状态 转换 是 由 从 Q X P 
到 QxTx |L,R| 子 集 的 函数 来 定义 的 。 

当 在 状态 转换 函数 提示 有 超过 一 个 动作 是 可 能 的 情况 下 ， 其 会 在 各 种 可 能 的 状态 转换 中 随机 选择 
一 个 。 输 入 字符 串 被 非 确定 型 图 灵机 接收 当 且 仅 当 有 任意 一 个 计算 在 接收 状态 终止 。 其 他 的 停留 在 非 
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接收 状态 的 计算 或 不 能 够 停机 的 计算 与 此 无 关 。 和 通常 一 样 ， 图 灵机 能 够 接收 的 语言 即 是 图 灵机 能 够 
接收 的 字符 串 的 集合 。 
例 8.7.1 下 图 所 示 的 非 确定 型 图 灵机 


alaR 
b/bR 
cle R 





(@) alaL 


接收 包含 一 个 c 的 字符 串 ， 且 这 个 c 在 字符 串 内 的 位 置 或 在 ab 之 前 或 在 ab 之 后 。 图 灵机 在 状态 q, 处 
理 输入 字符 串 ， 直 到 遇 到 c 字符 。 当 遇 到 字符 c 的 时 候 ， 图 灵机 仍然 处 于 q, 状态 ， 然 后 进入 q, 状态 
来 确定 c 是 否 在 ab 前 面 ,或 者 进入 qs 来 确定 c 是 否 在 ab 后 面 。 在 非 确 定型 语言 中 ， 图 灵机 的 计算 会 
JEFE c 然后 选择 一 个 条 件 来 检查 。 口 

在 例 8. 7. 1 中 构造 的 图 灵机 使 用 终结 状态 来 接收 字符 串 。 和 标准 图 灵机 一 样 ， 非 确定 型 图 灵机 的 接 
收 能 够 使 用 终结 状态 接收 或 者 使 用 停机 接收 。 非 确定 型 图 灵机 停机 接收 字符 串 &， 当 且 仅 当 计算 的 过 程 
中 有 任何 一 个 可 能 的 计算 在 读 字符 串 u 的 时 候 正常 停止 。 练 习 24 提出 了 另外 一 个 接收 同样 语言 的 方法 。 

非 确定 型 图 灵机 并 没有 增加 图 灵机 的 计算 能 力 ， 被 非 确定 型 图 灵机 接收 的 语言 和 被 确定 型 图 灵机 
接收 的 语言 并 没有 什么 差别 。 为 了 完成 非 确定 型 图 灵机 到 确定 型 图 灵机 之 间 的 转化 ， 我 们 将 会 展示 只 
有 一 个 输入 字符 串 的 多 重 计算 ， 能 够 被 依次 产生 和 检查 的 过 程 。 

非 确定 型 图 灵机 在 接收 一 个 字符 串 的 时 候 ， 往 往 会 产生 很 多 种 计算 过 程 。 通 过 给 所 有 可 供 选 择 的 
状态 转换 排序 ， 图 灵机 的 计算 能 够 被 系统 地 产生 。 考 虑 到 状态 的 合并 以 及 带 字符 的 情况 ,我 们 设 n 是 
状态 转换 的 最 大 数 。 计 数 假设 : 在 6( gq;,x) AD 的 情况 下 ， 对 于 每 个 状态 q 和 带 上 符号 x，6( q;,x) 定 
义 了 nn 个 (不必 不 相同 ) 转移 。 如 果 状 态 转 换 函 数 被 定义 的 少 于 nn 个 转换 ， 那么 ,为 了 完成 这 种 排 
序 ， 某 些 状态 转换 就 需要 被 分 配 多 个 数字 。 

FEU (m, ,m,,…mi) 的 序列 ， 其 中 每 个 i 是 从 1 到 的 数字 ,定义 了 在 非 确 定型 图 灵机 中 每 一 个 独 
一 无 二 的 计算 。 与 这 个 序列 相关 联 的 计算 包含 了 个 或 者 更 少 的 状态 转换 。 第 j 个 状态 转换 是 由 当前 
状态 ， 被 扫描 的 符号 ， 以 及 mw 一 一 序列 中 的 第 jj 个 元 素 一 一 共同 决定 的 。 假 定 第 j -1 个 状态 使 得 当前 
图 灵机 的 状态 为 正在 扫描 x 的 aq, BAE Slx) =Ø, WHE; 否则 ， 图 灵机 则 会 执行 8( gq; ,x) 
中 编号 为 m 的 转换 。 





表 8-1 转换 的 排序 
转换 
do B Iq, B, R 4» a 1q,, a, R 
2q,, B, R 2q,, a, R 
3q,, B, R 3q3, a, R 
qi a lg, a, R q3 b lq4, b, R 
2q,, a, R 2q,, b, R 
3q,, a, R 3Qy. by R 
qı b 1q,, b, R qs b lgs, b, L 
2q,, b, R 2455 b, L 
3qg,, b, R 345. b, E 
qi c lgi, c, R ds a 1q,, a, L 
209). c, M 2q,, a, L 
gs es D 3q,, a, L 
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例 8. 7. 1 中 的 非 确定 型 图 灵机 的 状态 转换 能 够 按照 表 8-1 中 一 样 排序 ， 当 输入 字符 串 为 acap,， 且 ， 


序列 为 (1,1,1,1,1),(1,1,2,1,1) 和 (2,2,3,3,1) 时 ， 图 灵机 的 计算 过 程 分 别 如 下 : 


qyBacabB 1 qyBacabB 1 qyBacabB 2 
I— Bq,acabB 1 I-Bq,acabB 1 I-Bq,acabB 2 
I- Baq,cabB 1 I-Baq, cabB 2 I-Baq,cabB 3 
I- Bacq,abB 1 I-Bacq,abB 1 I—-Bq,acabB. 
I- Bacaq,bB 1 I-Bacaq,bB 1 
I- Bacabq, B I-Bacabq,B 


每 一 个 转换 状态 右边 的 数字 指出 了 为 了 得 到 下 面 的 结构 所 需要 的 转换 。 第 三 个 计算 过 早 地 结束 了 ， 这 
是 因为 此 时 图 灵机 处 于 状态 g 且 正 在 扫描 的 符号 是 a， 而 这 个 运算 在 图 灵机 中 并 没有 定义 。 因 为 由 
(1,1,2,1,1) 定 义 的 计算 在 状态 q 结束 ， 所 以 串 acab 被 接收 。 

使 用 上 面 的 方法 ,使 得 非 确定 型 图 灵机 能 够 序列 化 地 产生 计算 过 程 ， 我 们 可 以 将 任意 一 个 非 确定 型 
图 灵机 转换 成 一 个 等 价 的 确定 型 图 灵机 。 设 M=(Q,,T,6,qo) 是 通过 停机 来 接收 字符 串 的 非 确 定型 图 
灵机 ， 这 里 我 们 之 所 以 选择 停机 接收 ， 是 因为 这 样 能 够 降低 图 灵机 计算 的 潜在 输出 的 个 数 ， 从 三 个 降低 
到 了 两 个 一 一 图 灵机 停机 (接收) 或 者 不 停机 。 因 而 我 们 在 证 明 的 过 程 中 就 只 需要 处 理 较 少 的 情况 。 
假定 图 灵机 M 已 经 按照 前 面 的 方法 对 其 状态 转换 进行 了 排序 ， 其 中 转换 状态 的 状态 (符号 对 ) 最 大 
数 是 n。 一 个 确定 的 三 带 图 录 机 M' 被 构造 成 与 M 接收 同样 的 语言 。 并 且 同 样 地 ，M' 也 是 停机 接收 。 

构造 图 灵机 M' 的 目的 是 模拟 图 灵机 M 的 计算 过 程 。M' 的 序列 (mm ,… ,mi ) 以 及 其 计算 过 程 之 间 的 
相关 性 保证 了 所 有 可 能 的 计算 都 能 被 顾及 。 三 带 图 灵机 M' 的 三 条 带 的 角色 分 别 如 下 : 

第 1 带 : 存储 输入 字符 串 ; 

第 2 带 : 模拟 M 的 带 ; 

第 3 带 : 用 (mm m) 的 形式 存储 序列 从 而 指导 整个 模拟 过 程 的 进行 。 

图 灵机 M' 的 计算 过 程 包含 下 面 的 动作 : 

一 个 从 1 到 的 整数 序列 (mi ,… ,mi) 被 写 在 第 3 带 上 。 

. 第 1 带 上 的 输入 字符 串 被 拷贝 到 第 2 带 上 的 标准 输入 的 位 置 ; 

. 在 第 2 带 上 模拟 第 3 带 上 被 序列 定义 的 M 的 计算 。 

. 如 果 在 执行 第 上 个 状态 转换 之 前 模拟 停止 了 ， 则 图 灵机 M' 的 计算 停止 并 且 接 收 字符 串 。 

5. 如 果 第 3 步 中 的 计算 并 不 停止 ， 则 第 3 带 上 将 会 生成 下 一 个 序列 ， 并 且 计 算 继续 从 第 二 步 开 始 
进行 。 

整个 模拟 过 程 由 第 3 带 上 的 序列 的 值 来 指引 。 图 8-1 中 的 确定 型 图 灵机 生成 了 所 有 的 由 从 1 到 nn 
的 整数 组 成 的 有 限 长 度 的 序列 。 其 中 1,，2，…, n 是 独立 的 带 符 号 。 长 度 为 1 的 序列 是 按照 数字 的 顺 
序 生成 的 。 然 后 是 长 度 为 2 的 序列 ， 再 然后 则 是 长 度 为 3 的 序列 ， 等 等 。 图 灵机 的 计算 从 状态 qo 开 
始 ， 此 时 带头 处 于 位 置 0 处 。 当 带头 再 次 回 到 位 置 0 的 时 候 ， 带 存储 有 下 一 个 序列 的 值 。 符 号 Ui 
1/1, 2/2, =, n/n 的 简写 。 

使 用 这 些 无 穷尽 的 数字 序列 ， 我 们 就 构造 了 一 个 确定 型 图 灵机 M'， 并 且 接 收 的 语言 恰好 是 
L(M) 。 图 灵机 M' 的 计算 过 程 交织 了 第 3 带 上 序列 的 生成 以 及 第 2 带 上 对 M 的 模拟 。M' 停 止 当 且 仅 
当 第 3 带 上 的 序列 定义 的 计算 在 M 上 停机 。 因 为 M 和 MI' 均 是 停机 接收 的 。 

HEMT ERRI M 的 输入 字母 表 与 带 字母 表 。 则 图 灵机 M ' 的 字母 表 是 : 

X4 =z 

T 2dx,sx| xeT 1 U11,---,n] 
#x 形式 的 符号 代表 了 符号 x， 但 是 表示 的 是 第 2 带 在 模拟 图 灵机 M 运算 的 过 程 中 最 左边 的 符号 。 图 灵 
机 M' 的 状态 转换 很 自然 地 通过 转换 函数 进行 了 分 组 。 有 状态 的 标记 q;; 用 于 第 3 带 上 序列 的 生成 。 
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B/I L 递增 序列 B/BR 


I2L 
返回 
mt X9) 


B/B R 


i/i R 
找到 序列 尾 


图 8-1 产生 {1, 2, =, n) * 的 图 灵机 ; 
这 些 状态 转换 能 够 由 图 8-1 中 描述 的 图 灵机 得 到 。 在 这 个 过 程 中 ， 读 第 1 带 和 第 2 带 的 带头 保持 
不 动 。 
8(q,,,B,B,B) 2 [q,, ;B,S;B,S;B,R] 
6(4, ,,B,B,t) 2 [9g,,;B,S;B, S; i, R] | EA, 
6(g.1,B,B,B) =[q,2;B,S;B,S;B,L] 
6(9g,,,B,B,n)- [4,2:B,5;B,8;1,L] 
6(q,,,B,B,t-1) = [4,45B,8;B,S;t.L] tz1,:,n-1 
8(4,,,B,B,B) 2 [q,, B, S;B,S;B,R] 
8(q,5,B,B,1) 2 [4,,;B, 5; B, S; 1, R] 
8(q,5,B,B,B) 2 [4,,;B, S; B, $;1,L] 
6(q,4,B,B,t) = yi B, S; B, S;t,L] tzT,n 
6(4,4,B,B,B) =[4.9;B,5;B,S;B,S] 
278 下 一 步 是 在 第 2 带 上 复制 输入 字符 串 。 符号 #B 被 写 在 位 置 0 上 来 标记 带 的 左边 界 。 
6(q,,,B,B,B) = = [4,,;B,RSSB,R;B,S] 
6( 4.1 ,x,B,B) - [q,, ix, R;x,R;B,S] ,其 中 所 有 xze 工 -| 
6( qea ,B,B,B) = la ;B,L;B,L;B,S] 
6(q,5,x,x,B) =(4.23x,L;x,L;B,S), APA xeT 
. ôlq.z,B,#B,B) -[qy;B,S;8B,S;B,R] 
模拟 图 灵机 M' 第 2 — 的 计算 的 转换 ， 可 直接 从 M 的 状态 转换 中 得 到 。 若 5(g;,x) = 
[9 ,y,d] 是 图 灵机 M 中 指派 给 排序 序号 为 1 的 转换 状态 ， 那么 
8(q;,B,x,t) = La BiSsy dit, R] 
6(q,,B,#x,t) 2 [9,5 B,S;fty,d;t,R] 
就 是 图 灵机 M' 中 的 相应 的 转换 状态 了 。 
如 果 第 3 带 上 的 序列 包含 了 大 个 数字 ， 那 么 顶 多 就 模拟 大 个 转换 。 如 果 图 灵机 M 对 于 第 3 E 
载 的 序列 停机 的 话 ， 则 图 灵机 M' 也 同样 停机 。 如 果 带 头 读 到 第 3 带 上 面 的 空白 ， 则 本 序列 中 的 所 有 
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状态 转换 已 经 被 模拟 完了 ， 在 下 一 个 序列 的 模拟 开始 之 前 , 第 2 带 上 面 的 模拟 计算 的 结果 都 必须 被 全 
部 清空 。 为 了 完成 这 个 过 程 ， 第 2 带 和 第 3 带 的 带头 都 被 重 置 到 了 最 左边 的 位 置 ， 并且 状 态 分别 是 
4.o 和 q。,， 然 后 第 2 带 的 带头 向 右 移动 ， 并 且 清 空 带 上 的 符号 。 

6(q;,B,x,B) 2[4,,;B,8;x,S; B,S] ,其 中 所 有 xeT 

6(g;,B,#x,B) =[9.9;B,S;#x,S;B,S] ,其 中 所 有 xeT 

6(g.0,B,x,B) =[ 4.o;B,S;x,L;B,S] ,其 中 所 有 x eT 

(4, ,B,flx,B) 2 [q,,;B,S;B,S;B,L] ,其 中 所 有 xeT 

8( des ,B,B,t) = [9,,:B,$; B, S,t,L].t£—1, ...,m 

8(4,,,B,B,B) 2[q,;;B,S;B,R;B,R] 

6(4,,,B,x,i) 2 [q,;; B, S; B,R;i, R] APRA xer Hi=l,...,n 

0(q,,,B,B,B) 2 [q,,;B, S; B,L;B,L] 

8(q,5,B,B,t) 2 [q,,;B,S;B,L;t,L] -t=1,...,n 

8(4,,,B,B,B) 2 [q4,,;B, S; B,S;B,S] 


如 果 第 3 带 上 面 读 到 空白 ， 那 么 带 上 的 所 有 在 模拟 过 程 中 读 取 的 位 置 均 会 被 清空 。 之 后 ， 图 灵机 
M' 则 返回 带头 的 初始 位 置 并 且 进 入 go 状态 ， 从 而 产生 下 一 个 序列 并 且 继 续 对 图 灵机 M 的 运算 进行 
模拟 。 

对 于 图 灵机 M 的 计算 的 模拟 过 程 ， 即 算法 的 第 二 步 到 第 五 步 ， 将 会 循环 ， 直 到 第 3 带 上 某 个 定义 
停机 计算 的 序列 出 现时 ， 才 会 停止 。 对 这 个 运算 的 模拟 将 会 使 图 灵机 M' 停 机 接收 输入 字符 串 。 如 果 
输入 的 字符 串 不 属于 L(M)， 则 序列 的 生成 以 及 对 于 图 灵机 M 的 计算 的 模拟 则 会 不 停 地 进行 下 去 。 

通过 下 面 策略 构造 的 确定 型 图 灵机 的 行动 使 用 了 例 8.7. 1 中 的 非 确定 型 图 灵机 以 及 表 8. 7.1 中 的 
状态 转换 进行 描述 。 若 图 灵机 M 由 序列 (1, 3, 3, 2, 1) 来 定义 ， 且 输入 字符 串 是 accbp， 则 最 开始 
的 三 个 状态 转换 是 : 


第 3 带 一 序列 
qoBaccbB 1 
I- Bq,accbB 3 
FF Baq,ccbB 3 
上 Bq,accbB 





这 些 状 态 转换 指出 了 ， 图 灵机 M 的 特定 计算 的 序列 1，3， 
3, 2, 写 在 图 灵机 M' 的 第 3 带 上 。 在 执行 M 的 第 三 个 状 
态 转换 之 前 ， 三 带 图 灵机 M' 的 格局 如 右 图 所 示 。 

若 图 灵机 M 在 状态 q 而 且 正 在 扫描 符号 c， 则 转换 状态 3 会 导致 图 灵机 打印 出 字符 ce， 并 且 进 入 状态 
qs ， 带 头 向 左 移动 。 这 个 转换 状态 被 图 灵机 M' 用 转换 8 (q ,B,c,3) =[4;;B,Sic,ZL;3,R] 激 发 。 根 据 
图 灵机 M 的 转换 状态 来 规定 图 灵机 M' 在 状态 转换 中 如 何 修 改 第 二 带 的 内 容 ， 并 且 移 动 第 3 带 的 带头 ， 


从 而 指出 后 面 的 状态 转换 的 标号 。 es 
非 确定 型 图 灵机 能 够 使 用 多 道 带 、 双 向 带 甚至 多 带 来 BUCS TEN 


进行 模拟 。 使 用 这 些 可 变 的 格局 来 定义 的 图 灵机 同样 能 够 ”第 ? 带 一 模拟 
接收 精确 的 递归 可 枚 举 语言 。 

和 确定 型 图 灵机 一 样 的 是 ， 终 结 状 态 接收 的 非 确定 。 第 ! 带 一 输入 [ ailde] 
型 图 灵机 能 够 用 来 判别 某 个 语言 是 递归 的 ， 如 果 该 非 确 
定型 图 灵机 的 任何 一 个 计算 导致 其 终止 的 话 ， 则 在 其 等 
同 的 确定 型 图 灵机 中 的 计算 也 应 该 同样 使 图 灵机 终止 
(练习 23)。 
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例 8.7.2 如 下 所 示 的 两 带 非 确定 型 图 灵机 


[a/a R,B/X R] [a/a R,XIX L] 
[b/b R,B/X R] [b/b RXIX L] 


iut [B/B R,B/B R 
M: @) B/B R, BIB R D [b/b R,B/B L] O ] 


接收 由 符号 1a, 引 组 成 的 字符 串 集 合 ， 其 中 心 恰 在 正中 间 。 从 gq, 到 gq, 的 状态 转换 需要 读 取 第 1 带 上 的 
符号 bp， 这 主要 是 用 来 猜测 b 是 否 恰 在 输入 字符 串 的 正中 。 状 态 q 的 循环 比较 了 4。 之 后 跟着 的 符号 的 
数目 与 5 之 前 的 符号 的 数目 。 如 果 输 入 字符 串 中 没有 包含 符号 bp， 则 会 在 状态 q 停机 ， 而 如 果 输 入 字 
符 串 中 的 5 不 在 正中 的 话 ， 图 灵机 将 会 在 q R a 停机 。 因 此 ， 既 然 图 灵机 M 在 遇 到 任何 输入 的 时 候 
均 停 机 ， 则 LI(M) 是 一 个 递归 语言 。 回 
下 一 个 例子 显示 了 多 带 图 灵机 与 非 确定 性 的 猜测 和 检查 机 制 相 结合 所 提供 的 灵活 性 。 
例 8.7.3 设 M=(Q,>,T,5,qg,E) 是 一 个 标准 图 灵机 ， 其 所 接收 的 语言 是 L。 我 们 下 面 设计 一 
个 两 带 非 确定 型 图 灵机 M'， 它 接收 字母 表 在 及 ”上 的 字符 串 ， 这 种 串 的 一 个 长 度 大 于 或 等 于 2 的 子 串 
在 语言 L 中 。 也 就 是 说 ,，L(M') = |u| u 2xyz,length(y) 2 且 yeL|。 如 果 输 入 是 w， 则 图 灵机 M H 
计算 包括 下 面 几 步 : 
l. 读 取 第 1 带 上 的 输入 字符 串 ， 并 且 非 确定 地 选择 这 个 字符 串 中 的 一 个 位 置 ， 从 而 开始 拷贝 子 字 
符 串 到 第 2 带 上 ; 
2. 从 第 1 带 拷贝 到 第 2 带 上 ， 然 后 非 确定 地 选择 一 个 位 置 停止 ; 
3. 在 第 2 带 上 模拟 图 灵机 M. 的 运算 。 
开始 的 两 个 步骤 包含 了 非 确定 型 地 猜测 u 的 某 一 个 子 串 ， 第 三 步 检查 了 是 否 该 子 串 是 工 的 一 部 分 。 
图 灵机 M' 的 状态 集合 是 QU 1gq,,9; ,9.,494,9.1， 并 且 初 始 状 态 是 9,。 字 和 母 表 和 终结 状态 集合 与 图 
灵机 M 是 一 样 的 。 转 换 状态 的 第 一 步 和 第 二 步 使 用 了 状态 dn dor der Ja 以 及 deo 
8'(q,,B,B) 21[q,;B,R;B,R]] 
8'(q,,x,B) = (La, ix, R;B,S] ,[ q sx, Rx, R]] APRA xe X 
8'(q, ,x,B) = |[ gq.;x,R;x,R],[ qu ix, Rsx, R]] PRA xe X 


8'(q,,x,B) 21[4,;x, R;B,S]] ,其 中 所 有 xe > 
8 (q,,B,B) = | [4,;B, S; B,L] } 
6'(q,,B,x) 2 1[q4,5 B, $;x,L]] ,其 中 所 有 xeX 


8'(q,,B,B) = | [4;B,S;B,S]} 


从 状态 q, 到 状态 q. 的 转换 初始 化 了 将 u 的 子 串 拷贝 到 第 2 带 上 的 这 个 过 程 。 状 态 a. 的 第 二 次 转换 完 
成 了 对 子 串 的 选择 。 在 状态 gs 中， 第 一 带 的 带头 移动 到 输入 字符 串 后 面 的 空白 处 ， 而 第 2 带 的 带头 则 
在 状态 q, 时 重新 移动 到 位 置 0。 

在 非 确定 地 选择 了 子 串 之 后 ， 图 灵机 M 的 状态 转换 就 在 第 2 带 上 开始 了 ， 同 时 还 检查 该 “ 正 被 
猜测 的 ” 子 串 是 否 是 属于 语言 工 的 。 这 一 部 分 计算 的 状态 转换 直接 由 -8 得 到 ， 即 图 灵机 M 的 状态 转 


” KRX: 


8'(q,,B,x) = |[g;;B,S;y,d]| ,其 中 6(g;,x) =[gq;,y,d] 是 图 灵机 M 中 状态 转换 。 当 图 灵机 在 第 二 
带 上 运算 的 时 候 ， 读 取 第 一 带 的 带头 则 会 一 直 保持 静止 。 D 


8.8 用 来 枚 举 语言 的 图 灵机 
在 本 节 中 的 图 灵机 将 被 形式 化 成 一 个 语言 接收 器 : 图 灵机 被 描述 成 具有 一 个 输入 字符 串 ， 并 且 通 
过 运算 的 结果 来 表示 是 否 接收 输入 字符 串 。 图 灵机 同样 能 够 被 设计 用 来 枚 举 一 个 语言 。 这 样 设计 的 图 


灵机 的 运算 往往 依次 生成 语言 的 无 穷 无 尽 的 实例 。 由 于 枚 举 图 灵机 没有 任何 的 输入 字符 串 ， 所 以 该 图 
灵机 会 一 直 计 算 ， 直 到 生成 该 语言 的 任何 一 个 实例 为 止 。 
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如 同 接收 语言 的 图 灵机 一 样 ， 有 多 种 方式 来 定义 一 个 枚 举 图 灵机 。 我 们 在 定义 枚 举 图 灵机 的 时 
候 ， 可 以 使 用 二 带 确 定型 图 灵机 作为 下 面 的 模型 ， 其 中 上 2。 第 一 带 是 输出 带 ， 而 其 他 的 带 则 是 用 
. 于 工作 的 带 。 特 殊 的 带 符号 # 被 用 在 输出 带 上 ， 来 分 离 在 计算 的 过 程 中 生成 的 语言 集合 中 的 每 一 个 
元 素 。 

此 处 涉及 的 图 灵机 需要 执行 两 个 不 同 的 任务 ， 接 收 以 及 枚 举 。 为 了 进行 区 分 ， 接 收 语言 的 图 灵机 
将 会 被 表示 为 图 灵机 M， 而 枚 举 图 灵机 则 要 被 表示 成 图 灵机 E, 

定义 8.8.1 一 个 k- 带 图 灵机 E=(Q, 了 ,TT,8,go) 枚 举 (enumerate) FL, wX: 

i) 图 灵机 运算 开始 的 时 候 ， 所 有 的 带 上 均 是 空白 ; 

ii) 在 每 一 个 状态 转换 的 时 候 ， 第 一 带 (输出 带 ) 的 带头 或 者 保持 不 动 ， 或 者 向 右 移动 。 

ii) 在 图 灵机 运算 的 任何 时 候 ， 第 一 带 上 非 空 的 部 分 的 形式 如 下 : 

Btu, #u,#. ... #u,# 或 者 Bitu #u,#. ... Huity 
KPueLHveY$E 

iv) FHP 将 会 被 写 在 第 一 带 上 ， 并 且 前 后 都 有 一 个 # 号 ， 当 上 且 仅 当 ueL 

最 后 一 个 条 件 表明 了 图 灵机 E 的 运算 能 够 枚 举 语言 L， 并 且 最 终 将 属于 语言 L 的 每 二 个 字符 串 写 
到 了 输出 带 上 。 由 于 需要 产生 语言 L 中 的 每 一 个 元 素 ， 如 果 图 灵机 E 需要 枚 举 的 是 一 个 无 穷 的 语言 ， 
则 图 灵机 永远 不 会 停机 。 定 义 中 并 不 要 求 机 器 停机 ， 即 使 枚 举 的 是 一 个 有 限 的 语言 。 这 样 的 图 灵机 有 
可 能 在 输出 带 上 写 完 了 语言 L 的 最 后 一 个 元 素 之 后 ， 同 样 永远 都 不 停止 。 

例 8.8.1 图 灵机 E 枚 举 语言 L=|ab'c |i=0|。 例 8.2.2 中 给 出 了 接收 该 语言 的 一 个 图 灵机 。 

[B/ aR,ala R] 






[B/#R,B/a S] 





[B/B R, B/B R] [B/#R, ala S] 







[B/B S, B/B L] 


@) ) [B/b R, ala L] 


[B/B S, B/B R] 


op [B/c R, ala R] 


[B/B S, Bla L] 


[B/#R,B/B R] 


[B/B S, ala L] 


图 灵机 了 HARI Ee ESAF RRR X e Lo F, FA a 被 写 到 第 二 带 的 第 一 
个 位 置 ， 且 带头 返回 到 带 的 第 0 个 位 置 。 在 这 个 时 候 ， 图 灵机 三 进入 到 如 下 动作 所 描述 的 不 终止 的 循 
环 中 : 

1. 在 工作 带 上 面 遇 到 任意 一 个 符号 a 的 时 候 ， 带 头 往 右 移动 ,并 且 在 输出 带 上 面 写 和 一 个 符 
号 ao 

2. 然后 工作 带 的 带头 从 右 向 左 移动 ， 移 过 所 有 的 字符 gc， 且 每 遇 到 一 个 字符 a， 则 在 输入 带 上 写 

3. 此 带头 向 右 移动 ， 当 工作 带 上 遇 到 任何 一 个 字符 a 的 时 候 ， 往 输出 带 上 写 入 一 个 字符 co 

4. 在 工作 带 的 最 后 一 个 位 置 加 上 一 个 字符 a， 并 且 带 头 移动 到 带 的 第 一 个 位 置 。 

5. 往 输 出 带 上 写 人 一 个 符号 #。 


283 
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当 某 一 个 字符 串 完 全 被 写 人 到 输出 带 上 之 后 ， 工 作 带 就 包含 了 在 这 个 枚 举 过 程 中 需要 构造 的 下 一 
个 字符 串 的 信息 。 L1 

定义 为 枚 举 ， 则 需要 该 语言 中 的 任意 一 个 字符 串 均 出 现在 输出 带 上 ， 但 同时 也 允许 一 个 字符 串 显 
示 多 次 。 定 理 8. 8. 2 显示 了 任意 一 个 能 够 被 图 灵机 枚 举 的 语言 ， 也 能 够 被 这 样 的 图 灵机 枚 举 ， 即 ， 该 
语言 中 的 每 一 个 字符 串 在 输出 带 上 仅 被 写 一 次 。 

定理 8.8.2 设 语言 工 是 图 灵机 王 枚 举 的 语言 ， 那 么 就 存在 能 够 枚 举 语 言 开 的 图 灵机 忆 '， 并 且 语 
言 工 中 的 每 一 个 字符 串 仅 在 图 灵机 王 ' 的 输出 带 上 出 现 一 次 。 

WEBB: 假设 图 灵机 了 是 一 个 二 带 图 灵机 ， 并 且 枚 举 语 言 L。 那 么 ， 能够 通过 K- 带 图 灵机 E 构造 
一 个 满足 “ 单 次 输出 ”需求 的 (KE+1)- 带 图 灵机 。 直 觉 上 ， 我 们 觉得 图 灵机 王 是 图 灵机 E' 的 一 个 子 图 
RHL, E 所 产生 的 字符 串 会 在 图 灵机 EE' 输 出 的 时 候 考 虑 。 在 EE 的 基础 上 再 加 上 一 条 带 即 构成 了 图 灵机 
E' 的 输出 带 ， 而 图 灵机 E 中 的 输出 带 则 成 为 了 图 灵机 BE' 中 的 一 条 工作 带 。 为 了 简洁 ， 我 们 把 第 1 带 称 
为 图 灵机 E' 的 输出 带 。 第 2 带 、 第 3 带 、…, 第 k+1 带 则 用 来 模拟 图 灵机 E。 在 模拟 图 灵机 E 的 过 程 
中 ,第 2 带 作为 输出 带 。 图 灵机 E' 的 动作 由 下 面 的 步骤 序列 组 成 : 

l. 图 灵机 E' 的 运算 开始 于 第 2、3、…,k+1 带 对 图 灵机 EE 的 动作 的 模拟 。 

2. 在 对 图 灵机 E 的 模拟 中 ， 当 在 第 2 带 上 写 下 #u# 的 时 候 ，E' 初 始 化 一 个 搜索 过 程 来 检查 u 是否 
已 经 存在 于 第 2 E. i 

3. 如 果 u AE 2 LE, WK usns x pL E' 的 输出 带 上 。 

4. 对 于 图 灵机 E 的 模拟 则 重新 开始 ， 并 且 开始 产生 下 一 个 字符 串 。 
寻找 另 一 个 & 是 否 在 第 2 带 上 ， 需 要 带头 检查 第 2 带 上 非 空白 的 所 有 部 分 。 由 于 第 2 带 不 是 图 灵机 E 
的 输出 带 ， 所 以 输出 带 的 带头 向 左 移动 的 情况 被 避免 了 。 g 

定理 8. 8. 2 说 明了 使 用 枚 举 这 个 术语 来 描述 这 种 类 型 的 运算 是 正确 的 。 运 算 中 属于 该 语言 的 字符 
串 被 依次 无 穷 无 尽 地 列举 出 来 。 生 成 字符 串 的 顺序 定义 了 自然 数 的 初始 顺序 到 语言 的 映射 ， 因 而 我 
们 能 够 讨论 语言 L 中 的 长 度 为 零 的 字符 串 ， 语言 L 中 的 第 一 个 字符 串 ， 等 等 。 这 种 顺序 与 图 灵机 有 
关 ， 另 外 一 个 枚 举 图 灵机 可 能 会 产生 一 个 完全 不 同 的 顺序 。 

现在 ， 图 灵机 的 运算 能 够 以 两 种 不 同 的 方式 来 定义 个 一 个 语言 : 接收 或 者 枚 举 。 我 们 展示 了 这 两 
种 方法 产生 同样 的 语言 。 

引 理 8.8.3 车 语言 被 图 灵机 枚 举 ,， 则 工 是 递归 枚 举 语 言 。 

WEBB: 设 L 被 x- 带 图 灵机 E 枚 举 。 那 么 , 一 个 同样 接收 语言 L 的 (k+1)- 带 图 灵机 M 能 够 由 图 
灵机 EE 构造 出 来 。 图 灵机 M 比 图 灵机 多 的 那 条 带 作为 输入 带 ， 而 剩余 的 k 条 带 则 是 图 灵机 M 用 来 
模拟 图 灵机 E 的 。 和 开始 的 时 候 ， 图 灵机 M 的 输入 带 上 面 有 字符 串 &， 然 后 图 灵机 M 就 开始 模拟 图 灵 
机 EE 的 运算 。 当 在 对 图 灵机 E 的 模拟 中 写 下 符号 # 时 ， 则 生成 字符 串 weL。 图 灵机 M 则 对 字符 串 w 
和 字符 串 u 进行 比较 ， 如 果 w=w， 则 接收 字符 串 wu; 否则 ， 则 通过 对 图 灵机 EE 的 模拟 来 生成 语言 工 的 
另外 一 个 字符 串 ， 然 后 比较 的 过 程 会 继续 进行 。 若 ue L， 则 其 终 将 被 图 灵机 E 生成 ， 然 后 被 图 灵机 
M 所 接收 。 a 

在 上 述 的 证 明 中 ， 由 于 接收 语言 工 的 图 灵机 M 并 不 会 针对 每 一 个 输入 字符 串 而 停机 ， 因 此 这 导 
致 了 枚 举 任何 一 个 递归 可 枚 举 语言 工 是 十 分 困难 的 。 很 直接 地 枚 举 语言 工 的 方式 是 构造 一 个 枚 举 图 灵 
机 来 模拟 图 灵机 M 的 运算 ， 从 而 确定 某 个 字符 串 是 否 应 该 写 在 输出 带 上 。 这 样 的 图 灵机 的 动作 应 
该 是 : 

l. 生成 一 个 字符 串 we X^; 

2. 使 用 输入 字符 串 u 来 模拟 图 灵机 M 的 运算 ; 

3. 如 果 图 灵机 M 接收 该 字符 串 ， 则 将 字符 串 u 写 到 输出 带 上 。 

4. 继续 步骤 1 EBM iX se D ^ 中 的 所 有 字符 串 。 

这 种 生成 一 测试 的 方法 需要 能 够 生成 字母 表 刁 上 的 所 有 字符 串 的 集合 。 这 一 点 并 不 难 ， 具 体 方法 后 面 
会 讲 到 。 然 而 ， 这 种 方法 的 第 2 步 导致 了 它 的 失败 。 因 为 有 可 能 会 产生 一 个 字符 串 w， 而 字符 串 u 可 
能 会 导致 图 灵机 M 永 不 终止 。 在 这 种 情况 下 ， 所 有 在 字符 串 u 之 后 的 字符 串 都 不 能 够 产生 而 且 同 样 也 
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不 能 够 被 测试 是 否 属于 语言 Lo 

为 了 构造 一 个 枚 举 图 灵机 ,我们 首先 要 介绍 输入 字符 串 的 字典 顺序 ， 然 后 提供 一 个 策略 来 保证 枚 
举 图 灵机 EE 将 会 检查 字母 表 "中 的 每 一 个 字符 串 。 在 非 空 字母 表 卫 上 的 字符 串 集 合 的 字典 顺序 定义 
了 在 自然 数 与 和 * 上 字符 串 之 间 的 一 一 对 应 。 

定义 8.8.4 RE= la,--,a,] 是 一 个 字母 表 ， 有 "上 的 字典 顺序 (lexicographical ordering) 
lo 被 递归 地 定义 为 : 

i) 基础 步骤 : Jo( 入 ) =0,lo(a,) =i, HP i=1,2,--,n 

ii) 递归 步骤 : lo(au) =lo(u) +i+ n^" 。 

被 函数 lo MRAM TERE E 上 定义 了 一 个 完全 的 顺序 。 字 符 串 上 & Rv 满足 &<vw=v 以 及 wk>v， 
如 果 lo(u) «lo(v) lo(u) =1o(v) 以 及 1o(z) »lo(v), 

例 8.8.2 KY -la,b,cl, Jt Hit a, b Alc 分别 被 赋值 为 1、2 和 3。 那 么 字母 表 上 的 字典 顺序 
如 下 : 

lo(X) =0 lo(a) =1 lo(aa) =4 lo( ba) =7 lo(ca) =10 lo( aaa) =13 

lo(b) =2 lo(ab) =5 lo( bb) =8 lo(cb) =11 lo(aab) =14 
lole) =3 lo(ac) =6 lo(bc) =9 lo(cc) =12 lo(aac) =15 L1 

引 理 8. 8.5 xL TAE THERY, AE — MEET ROIUCPHOEY MH BXI E, o 

枚 举 字母 表 |0,11 上 的 字符 串 集 合 的 图 灵机 的 构造 留 下 来 作为 习题 。 

字典 顺序 以 及 吻合 技术 用 来 展示 某 个 递归 枚 举 语言 工 能 够 被 图 灵机 枚 举 。 设 图 灵机 M 是 接收 语 
言 工 的 图 灵机 ， 且 图 灵机 M 不 需要 因为 任何 输入 字符 串 而 停机 。 按 照 字典 顺序 在 对 * 的 字符 串 集合 上 
建立 了 一 个 列表 ww =r, UW, u, Ww，…， 并且 建 立 了 一 个 二 维 的 图 表 ， 其 中 行 用 于 "上 的 字符 串 来 标 
记 ， 而 列 则 使 用 自然 数 来 标记 。 
表 中 的 项 [i, j] 被 解释 为 “运行 图 灵机 M， 其 中 输入 字符 串 
是 wu， 需要 运行 j 步 ”"， 使 用 例 1.4:2 中 介绍 的 技术 ， 这 个 表 
中 的 有 序 对 能 够 以 一 种 对 角 线 的 方式 被 枚 举 (练习 33)。 

图 灵机 E 中 创建 并 用 来 枚 举 语 言 工 的 过 程 ， 插 入 了 图 灵 
机 M 的 运算 中 对 有 序 对 的 枚 举 。 而 图 灵机 E 的 运算 则 是 一 个 
包含 了 下 面 步 骤 的 循环 : 

1. 生成 一 个 有 序 对 li, jlo 

2. 使 用 输入 字符 串 古 ,并且 进行 了 步 ， 或 直到 停机 ,来 进 1 
行 对 图 灵机 M 的 模拟 。 

3. 如 果 图 灵机 M 接收 ， 则 将 写 到 输出 带 上 。 i 

4. 继续 步骤 1。 
fiueL, WE SLM 在 其 输入 字符 串 是 u 的 时 候 ， 停 机 并 
且 在 个 状态 转换 之 后 接收 字符 串 ， 因 而 当 有 序 对 [i,k] 被 处 
理 的 时 候 ，u; 会 被 写 到 输出 带 上 。 有 序 对 [ i, 站 的 第 二 个 元 素 保证 了 对 图 灵机 M 的 模拟 将 会 在 j 步 后 
停止 。 而 随后 发 生 的 ， 就 是 所 有 不 能 够 停止 的 运算 都 不 允许 出 现 ， 并 且 "中 的 每 一 个 字符 串 均 会 被 
检查 到 。 

将 引 理 8. 8.3 与 前 面 的 论据 合并 就 产生 了 下 面 的 定理 S. 8. 6。 

.定理 8.8.6 一 个 语言 是 递归 可 枚 举 的 当 且 仅 当 它 能 够 被 一 个 图 灵机 所 枚 举 。 

接收 递归 可 枚 举 语言 的 图 灵机 停机 并 且 接 收 语言 中 的 每 一 个 字符 串 ， 但 是 在 这 个 过 程 中 ， 停 机 并 
不 是 必须 的 ， 尤 其 是 当 输 入 的 字符 串 并 不 属于 这 个 语言 的 时 候 。 语 言 工 是 一 个 递归 语言 ， 当 它 被 对 所 
有 输入 字符 串 均 停机 的 图 灵机 所 接收 的 时 候 ， 由 于 每 一 个 计算 均 停 机 ， 因 此 这 样 的 图 灵机 等 于 是 提供 
一 个 决定 过 程 ， 通 过 这 个 过 程 来 确定 某 一 个 字符 串 是 不 是 属于 语言 工 。 递 归 语言 的 集合 也 能 用 枚 举 图 
灵机 来 定义 。 





285 








287 














288 








166 三 部 分 Tia HH 





枚 举 图 灵机 的 定义 并 没有 对 语言 中 字符 串 生成 的 顺序 做 出 任何 的 约束 。 以 预定 的 计算 顺序 生成 所 


”需要 的 字符 串 则 会 提供 一 些 用 来 判断 其 是 否 属于 该 语言 的 额外 信息 。 从 直觉 上 来 看 ， 用 来 确定 某 个 字 


FB 是 否 属于 该 语言 的 策略 ， 是 使 用 枚 举 图 灵机 ， 并 将 字符 串 u 和 图 灵机 生成 的 每 一 个 字符 串 相 比 
较 。 最 终 u 或 者 在 输出 带 上 (被 接收 ) ， 或 者 某 个 按 序 排 在 二 后 面 的 字符 串 被 生成 。 由 于 输出 字符 串 
按 序 生成 的 ， 因此 w 就 被 忽略 了 且 不 属于 该 语言 。 于 是 我 们 就 能 够 来 确定 某 个 字符 串 是 否 属于 该 语 
言 ， 并 且 该 语言 是 否 为 递归 的 。 定 理 8. 8.7 展示 了 枚 举 语言 有 可 能 被 冠 以 下 面 的 特性 ， 即 该 语言 的 元 
素 能 够 按照 顺序 被 枚 举 。 

定理 8.8.7 语言 L 是 递归 的 ， 当 且 仅 当 语言 L 能够 以 字典 顺序 被 枚 举 。 

证 明 : 我 们 首先 来 证 明 每 一 个 递归 语言 能 够 以 字典 顺序 被 枚 举 。 设 语言 工 是 字母 表 忆 上 的 递归 语 
言 ， 而 且 语言 工 能 够 被 某 个 图 灵机 M 所 接收 ， 该 图 灵机 M 对 所 有 的 输入 字符 串 都 停机 。 能 够 以 字典 
顺序 枚 举 语 言 工 的 图 灵机 E， 能 够 由 图 灵机 M 和 图 灵机 Ex ,来 构造 ， 其 中 图 灵机 Exy. 能 够 以 字典 顺序 
枚 举 语 言 " 。 图 灵机 E 是 一 个 混合 的 ， 包含 了 图 灵机 M 和 图 灵机 了 >, 的 运算 。 图 灵机 EE 的 运算 包括 
下 面 的 循环 : 

1. 图 灵机 By .运行 ， 并 生成 字符 串 xe L". 

2. 图 灵机 M 使 用 4 作为 输入 字符 串 来 运行 。 

3. 如 果 图 灵机 M 接收 字符 串 u, W & 即 被 写 到 图 灵机 EE 的 输出 带 上 。 

4. 这 种 生成 一 测试 的 循环 从 步骤 1 开始 继续 。 -— 

由 于 图 灵机 M 针对 任意 的 输入 均 停 机 ， 所 以 图 灵机 了 不 可 能 在 步 又 2 中 不 停机 。 因 而 任意 的 字符 串 
ue Y "都 将 被 生成 且 被 测试 其 是 否 属 于 语言 工 。 

现在 我 们 就 能 够 证 明 任 意 能 够 以 字典 顺序 枚 举 的 语言 工 都 是 递归 的 。 证 明 将 依据 语言 工 的 集合 的 
势 被 分 成 两 个 不 同 的 部 分 。 

情形 1: 语言 L 是 有 限 的 。 因 为 任何 有 限 的 语言 都 是 递归 的 ， 所 以 可 知 语言 L 是 递归 的 。 

情形 2: 语言 L 是 无 限 的 。 这 个 情形 与 定理 8.8.2 中 给 出 的 类 似 ， 只 有 一 点 除外 ， 就 是 定理 8. 8.2 
中 的 顺序 数 是 用 来 终止 图 灵机 的 运算 的 。 和 前 面 的 一 样 ， 一 个 (Kk+1) - 带 的 接收 语言 工 的 图 灵机 M 
能 够 由 一 个 以 字典 顺序 枚 举 语 言 L 的 k- 带 图 灵机 构造 出 来 。 图 灵机 M 的 额外 一 条 带 用 来 作为 输入 带 ， 
图 灵机 M 剩 下 的 上 条 带 允 许 其 模拟 图 灵机 也 的 运算 。 图 灵机 E 产生 的 字符 串 的 顺序 提供 了 当 输 入 的 
字符 串 不 属于 语言 工时 ， 图 灵机 M 停机 所 需要 的 信息 。 图 灵机 M 的 运算 开始 于 字符 串 在 输入 带 上 ， 
下 面 就 是 图 灵机 M 模拟 图 灵机 E 的 运算 了 。 当 在 模拟 的 过 程 中 生成 了 字符 串 w 时 ,图 灵机 M SH u 
和 w 进行 比较 ， 如 果 usw, MARI M 停机 并 且 接 收 字符 串 ws 如 果 w 在 顺序 上 比 w 大 ， 则 图 灵机 
M 停机 并 且 拒 绝 该 输入 字符 串 。 最 后 ， 如 果 w 在 顺序 上 比 w 小 ， 则 图 灵机 EE 的 模拟 过 程 重新 开始 ， 以 








便 生 成 语言 工 的 另外 一 个 元 素 ， 然 后 继续 进行 这 种 比较 的 过 程 。 m 
8.9 练习 
1. 设 图 灵机 M 由 下 表 定 义 

qo q, B, R 

q, gy B, L qa, R 4c, R qvo, R 

gd; In C, L qab, L 


a) 当 输入 字符 串 是 aabca 的 时 候 ， 具 体 描述 图 灵机 M 的 运算 过 程 。 
b) 当 输入 字符 串 是 bebe 的 时 候 ， 具 体 描述 图 灵机 M 的 运算 过 程 。 
c) 给 出 图 灵机 M 的 状态 图 。 
d) 描述 图 灵机 M 的 某 个 计算 过 程 的 结果 。 

2. 设 图 灵机 M 由 下 表 定 义 
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qo q,,B,R 
qı qıB,R qua, R qi b,R qs6L 
qz qab, L qa, L 


a) 当 输 入 字符 串 是 abcab 的 时 候 ， 具 体 描述 图 灵机 M 的 运算 过 程 。 

b) 当 输 入 字符 串 是 abab 的 时 候 ， 具 体 描 述 图 灵机 M 的 前 六 个 状态 转换 的 运算 过 程 。 
c) 给 出 图 灵机 M 的 状态 图 。 

d) 描述 图 灵机 M 的 某 个 计算 过 程 的 结果 。 

3. 当 输 入 字母 表 是 1a,b| 的 时 候 ， 构 造 一 个 图 灵机 来 完成 下 面 的 每 一 个 操作 。 要 注意 的 是 ， 在 状态 gj 的 时 

fe, 无 论 计算 是 否 终止 ,带头 都 正在 扫描 第 零 个 位 置 。 

a) 将 输入 字符 串 向 右 移动 一 个 位 置 。 输 入 格局 是 qoBuB， 结 果 格 局 是 q,BBuB, 

b) 将 输入 字符 串 翻转 之 后 再 连接 到 输入 字符 串 后 边 。 输 入 格局 是 quBuB， 结 果 格 局 是 qBBuu B, 

*c) 将 输入 字符 串 的 每 两 个 字符 中 加 入 一 个 空白 ， 例 如 : 输入 格局 是 96BabaB， 结 果 格 局 是 qjBaBbBaB。 
d) 将 输入 字符 串 中 的 5 全 部 删除 。 例 如 : 输入 格局 是 q6BbabaababB， 结 果 格 局 是 qjBaaaaB。 

4. 当 输 入 字母 表 是 |a,b,c| 的 时 候 ， 构 造 一 个 图 灵机 ， 其 接收 的 字符 串 要 求 第 一 个 字符 c 需要 紧 跟 在 子 串 
aaa 之 后 ， 图 灵机 只 能 够 接收 含有 一 个 字符 c 的 字符 串 。 

5. 当 输 入 字母 表 是 | a,b} 的 时 候 ， 构 造 一 个 图 灵机 ， 并 且 要 使 用 终结 状态 方式 来 接收 下 面 的 每 一 个 语言 。 
a) la'ib' |i=0, jæi} 
blah abili j 50] 

c) 具有 相同 数目 的 a Al b 的 字符 串 
d) {uu | uela,b] "| 
e) {uu| ue la,b] *] 

6. 修改 5 (a) 中 的 图 灵机 ， 使 得 该 图 灵机 能 够 使 用 停机 方式 来 接收 语言 1a'b | i20, jail. 

7. 另外 一 种 使 用 终结 状态 方式 接收 的 图 灵机 定义 如 下 : 字符 串 被 图 灵机 M 接收 ， 如 果 输 入 字符 串 是 4 的 
图 灵机 M 的 计算 进入 终止 状态 〈 不 一 定 会 停机 ) 。 在 这 个 定义 下 ， 即 使 图 灵机 不 停机 ， 字 符 串 也 能 够 被 
其 接收 。 证 明 这 种 定义 下 的 被 接收 的 语言 是 递归 可 枚 举 语言 。 

8. 单 带 确定 型 图 灵机 的 状态 转换 能 够 使 用 一 个 部 分 函数 来 定义 ， 函 数 的 定义 域 是 Q xT, 值 域 是 Q xT x |L, 
R,S| ,其 中 5 指出 带头 保持 不 动 。 证 明 以 这 种 方式 定义 的 图 灵机 接收 的 语言 是 递归 可 枚 举 语 言 。 

9. 原子 图 灵机 (atomic turing machine) 是 这 样 的 图 灵机 ， 每 一 个 转换 均 包 括 一 个 状态 的 改变 以 及 一 个 
其 他 的 动作 ， 其 中 的 动作 可 能 是 在 带 上 面 写 人 字符 或 者 移动 带头 ， 但 是 不 能 同时 做 这 两 件 事情 。 证 
明 原 子 图 灵机 接收 的 语言 是 递归 可 枚 举 语 言 。 

“10. 上 下 文 有 关 的 图 灵机 ( context-sensitive turing machine) 是 这 样 的 图 灵机 ， 决 定 其 状态 转换 的 因素 
不 仅仅 是 当前 正在 扫描 的 字符 ， 还 与 带头 右边 的 带 方块 中 的 符号 有 关 ， 其 状态 转换 有 如 下 的 形式 : 
8(q,,xy) =[ gq;,z,d] x,y,zeT;de {L,R} 
当 图 灵机 现在 处 于 状态 %， 且 正在 扫描 字符 x 时， 上 述 的 状态 转换 仅 当 带 头 右边 的 带 位 置 中 恰好 
有 一 个 y 的 时 候 才能 够 发 生 。 在 这 种 情况 下 ， 使 用 z 来 替换 x， 然 后 图 灵机 进入 状态 qj. iPS IAL d 
指出 的 方向 移动 一 格 。 
a) 设 图 灵机 M 是 一 个 标准 图 灵机 。 定义 一 个 上 下 文 有 关 的 图 灵机 M' 来 接收 语言 L(M) 。 提 示 ; 
根据 图 灵机 M 的 状态 转换 来 定义 图 灵机 M' 的 状态 转换 。 
b) BE S(q,.xy) =[giiz, 加 是 一 个 上 下 文 有 关 的 状态 转换 。 证 明 这 个 状态 转换 应 用 的 结果 能 够 通过 
对 标准 图 灵机 的 一 系列 的 状态 转换 来 得 到 。 你 必须 考虑 两 种 情况 ， 即 5 C, xy) 什么 时 候 是 
可 用 的 以 及 不 可 用 的 。 
c) 使 用 上 述 两 点 来 得 出 结论 : 上 下 文 有 关 的 图 灵机 接收 的 语言 是 递归 可 枚 举 语言 。 
11. 证 明 每 一 个 递归 可 枚 举 语言 都 能 够 被 仅 有 一 个 接收 状态 的 图 灵机 接收 。 
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构造 一 个 双向 图 灵机 ， 其 输入 字母 表 是 Ea} ， 当 带 包含 非 空白 符号 的 时 候 停 机 。 符 号 a 可 能 在 带 
上 的 任意 一 个 位 置 ， 而 不 一 定 在 紧 挨 着 带头 的 右边 方块 中 。 

二 维 图 灵机 (two-dimensional turing machine) 是 这 样 的 一 个 图 灵机 ， 

其 带 包含 了 二 维 数组 的 带 方块 。 

状态 的 转换 包括 了 重 写 某 个 方块 ， 以 及 将 带头 移动 到 相 邻 的 四 个 方 

块 中 的 任意 一 个 中 。 图 灵机 的 运算 开始 于 带头 在 最 角落 的 方块 。 这 

个 二 维 图 灵机 的 状态 转换 被 写作 8(4,,x) =[9,,y,4]， 其 中 4 可 能 是 

UCE) DCF) L(A)URR (A) 这 四 个 方向 中 的 任意 一 个 。 设计 

这 样 的 一 个 二 维 图 灵机 ， 其 输入 字母 表 是 1a} ,而 且 当 带 包含 非 空 


方块 的 时 候 停 机 。 
. 设 L AFR a,b) 上 的 回 文 的 集合 : 四 


a) 设计 一 个 接收 语言 工 的 标准 图 灵机 ; 
b) 设计 一 个 接收 语言 工 的 两 带 图 灵机 ， 其 中 当 输 入 字符 串 是 立 的 时 候 ， 图 灵机 的 运算 不 会 超过 
3length(u) +4 个 状态 转换 。 


. SA SEER AE a,b) 的 时 候 ， 构 造 一 个 接收 语言 1a'p” | 这 01 的 两 带 图 灵机 ， 其 中 ， 和 输入 带 的 带 


头 仅仅 从 右 向 左 移动 。 


- MA PEER | a,b,c} 的 时 候 ， 构 造 一 个 接收 语言 |a'b'c'| i20] 的 两 带 图 灵机 。 
当 输 入 字母 表 是 |a,b| 的 时 候 ， 构 造 一 个 接收 具有 相同 a RU b 的 字符 串 的 两 带 图 灵机 。 当 输入 字符 


串 是 的 时 候 ， 图 灵机 的 运算 不 会 超过 21ength(u) +3 个 状态 转换 。 


构造 一 个 两 带 图 灵机 ， 其 接收 的 字符 串 中 ,每 一 个 a 后面 b 的 个 数 是 递增 的 ， 也 就 是 说 ， 字 符 串 


需要 具有 下 面 的 形式 : 
ab^ ab^---ab^, k»0 
Hn <n, <… «n, 


构造 一 个 非 确 定型 图 灵机 ， 其 输入 字母 表 是 1a,b} ， 并 且 输 入 字符 串 包含 一 个 满足 下 面 两 个 属性 


的 子 串 u: 

i) uN REKFRAS F 3; 

ii) ub SWS am m b 一 样 的 多 。 

构造 一 个 接收 语言 工 = {uvuw| ue |a, b} v, wela,b] "| 的 两 带 非 确定 型 图 灵机 ， 如 果 一 个 字符 
串 包含 两 个 不 重 全 的， 完全 一 致 的 ， 长 度 为 5 的 子 串 的 话 ， 则 说 明 该 字符 串 是 语言 工 的 一 个 元 素 。 
当 输入 字符 串 是 w 的 时 候 ， 图 灵机 需要 在 至 多 2length(w) +2 个 状态 转换 之 后 停止 。 
构造 一 个 接收 语言 L = | uu | ue |a,b} “| 的 两 带 非 确定 型 图 灵机 。 当 输入 字符 串 是 w 的 时 候 ， 图 灵 
机 需要 在 至 多 2length(w) +2 个 状态 转换 之 后 停止 。 如 果 是 例 8. 6. 2 中 定义 的 确定 型 图 灵机 ， 其 接 
收 语言 工 ， 在 输入 字符 串 的 长 度 是 普 的 情况 下 ， 最 大 的 状态 转换 的 次 数 是 多 少 ? 

设 图 灵机 M = |Q, 允 ,T,6,4, F] 是 一 个 标准 图 灵机 ， 它 接收 语言 L。 设 计 一 个 接收 袜 EFRR w 
的 图 灵机 M'， 当 且 仅 当 w 有 一 个 子 串 是 语言 L 中 的 元 素 。 

设 语言 工 是 非 确定 型 图 灵机 接收 的 语言 ， 其 中 每 二 个 计算 都 能 够 结束 ， e LL 是 递归 的 。 

如 果 假 设 条 件 换 成 非 确定 型 图 灵机 ， 证 明定 理 8.3.2。 — 

证 明 每 一 个 有 限 语 言 都 是 递归 的 。 

证 明 语言 工 是 递归 的 当 且 仅 当 工 5 L 的 补 集 都 是 递归 可 枚 举 的 。 

证 明 弟 归 语 言 在 进行 并 、 交 以 及 补 运 算 时 是 封闭 的 。 

图 8-1 展示 了 产生 所 有 由 整数 1 到 组 成 的 序列 的 图 灵机 ， 当 n=3 时 ， 试 写 下 最 开始 的 七 个 循环 。 
一 个 循环 包括 带头 再 次 回 到 初始 位 置 并 且 又 进入 gy 状态 。 

构造 一 个 图 灵机 ， 该 图 灵机 枚 举 所 有 {a} 上 的 偶数 长 度 的 字符 串 。 

构造 一 个 枚 举 集合 |a'ip | Os ij] 的 图 灵机 。 

构造 一 个 枚 举 集合 a” | n20]. 的 图 灵机 。 
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Fa — TCE D DELE, HPD = 11,0], ER: 该 图 灵机 有 可 能 需要 考虑 枚 举 所 有 有 限 
长 的 比特 串 。 

构造 一 个 图 灵机 ， 该 图 灵机 枚 举 有 序 对 NxN,， 使 用 ma+1 个 1 的 串 来 代表 数字 n AFX Li, j] 
的 输出 如 下 : 代表 数字 1 的 串 后 面 紧 跟着 一 个 空白 , 然后 是 代表 数字 jj 的 串 。 而 标记 符 # 则 需要 包 
围 着 整个 有 序 对 。 

在 定理 8. 8.7 中 ， 关 于 每 一 个 递归 语言 都 能 够 以 字典 顺序 枚 举 的 证 明 ， 将 有 限 和 无 穷 语言 分 开 考 
虑 了 ， 对 于 无 穷 语言 的 证 明 也 许 对 于 有 限 语言 来 说 并 不 充分 ， 为 什么 ? 

定义 两 道 非 确定 型 图 灵机 的 组 成 。 证 明 这 些 图 灵机 接收 的 语言 恰 是 递归 可 枚 举 语言 。 

证 明 每 一 个 上 下 文 无 关 的 语言 都 是 递归 的 。 提 示 : 构造 一 个 两 带 的 非 确定 型 图 灵机 来 模拟 下 推 自 
动机 的 运算 过 程 。 


参考 文献 注释 


图 灵机 最 初 作 为 算法 计算 的 一 个 模型 由 图 灵 [1936] 提出 。 图 灵 最 初 设计 的 图 灵机 是 确定 型 的 ， 


包含 一 个 双向 无 限 带 以 及 一 个 带头 。 无 独 有 偶 ， 波 斯 特 【1936] 提出 了 一 系列 的 抽象 机 器 ， 且 这 些 机 
器 和 图 灵机 具有 同样 的 计算 能 力 。 


使 用 图 灵机 来 进行 函数 的 运算 将 在 第 9 章 详细 讨论 ， 而 图 灵机 作为 语言 的 识别 者 时 的 能 力 以 及 限 


制 则 会 在 第 10 章 和 第 11 章 里 介绍 。Keleen [1952], Minsky [1967], Brainerd, Landweber [1974] 
以 及 Hennie [1977] 著 的 书 中 对 图 灵机 的 计算 能 力 给 出 了 一 个 全 面 的 介绍 。 
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BIS 图 灵 可 计算 函数 


在 前 面 的 章节 中 ， 图 灵机 为 接收 语言 提供 了 一 个 可 计算 的 框架 。 运 算 的 结果 由 终结 状态 或 者 停机 
来 确定 。 在 任意 情况 下 均 有 两 种 不 同 的 结果 : 接收 或 者 拒绝 。 图 灵机 的 计算 结果 同样 可 以 在 停止 时 ， 
通过 在 带 上 写 下 某 些 符号 来 定义 。 通 过 停机 时 带 中 所 允许 的 格局 的 无 限 多 种 可 能 性 来 定义 最 终 的 结 
果 。 在 这 种 方式 下 ， 图 灵机 的 计算 产生 了 从 输入 字符 串 到 输出 字符 串 之 间 的 一 个 映射 ， 也 就 是 说 ， 图 
灵机 计算 了 一 个 函数 。 当 字符 串 用 自然 数 来 解释 时 ， 图 灵机 则 能 够 用 来 计算 数论 函数 。 下 面 ， 我 们 将 
展示 出 几 种 重要 的 数论 函数 是 图 灵 可 计算 的 ， 并 且 这 种 可 计算 性 在 函数 的 组 合 之 下 也 是 相近 的 5 而 在 
第 13 章 我 们 则 会 对 图 灵机 所 能 计算 的 函数 集合 进行 一 个 更 加 全 面 的 分 类 。 

本 章 的 结束 部 分 会 总 结 怎样 使 用 图 灵机 的 体系 结构 来 定义 高 级 编程 语言 。 这 一 点 将 图 灵机 与 现代 
生活 中 我 们 所 熟悉 的 可 计算 范 型 一 一 计算 机 紧密 地 联系 在 了 一 起 。 


9.1 函数 的 计算 


函数 f: X —— Y 是 一 种 映射 ， 对 定义 域 X 中 的 每 一 个 元 素 ， 最 多 在 值 域 Y 中 分 配 一 个 值 与 之 相 
对 应 。 从 计算 的 角度 来 说 ， 我 们 将 j 的 变量 作为 函数 的 输入 。 函 数 的 定义 并 不 明确 地 指出 怎样 从 输入 
x 如何 获 取 玉 x) 一 一 通过 函数 指派 给 x 的 值 ， 但 是 却 可 以 设计 相应 的 图 灵机 来 计算 函数 的 值 。 图 灵 
机 计算 出 的 某 个 函数 的 定义 域 和 值 域 , 包含 了 由 图 灵机 字母 表 生 成 的 字符 串 。 

能 够 计算 函数 的 图 灵机 有 两 个 特殊 的 状态 : 初始 状态 qu 和 终止 状态 q, 计算 开始 于 由 初始 状态 开 
始 的 一 个 转换 ， 此 时 图 灵机 的 带头 停留 在 输入 字符 串 的 开始 位 置 。 自 此 以 后 ， 图 灵机 不 会 再 次 进入 gq。 
状态 ， 该 状态 所 仅 有 的 作用 就 是 初始 化 图 灵机 的 计算 ;而 所 有 会 终止 的 计算 都 会 在 状态 a, 终止， 从 带 
的 第 一 个 位 置 开始 ， 将 函数 值 写 到 带 上 。 这 些 条 件 都 在 定义 9. 1. 1 中 被 形式 化 了 。 

定义 9.1.1 确定 型 单 带 图 灵机 M=(Q, 下 ,TT,6,qo,9/) 计 算 一 元 函数 J LL’, wR: 

i) 从 状态 go 开始 仅 有 一 个 转换 ， 且 这 个 转换 形式 如 下 : 6( qo,B) 2 [q;,B,R]; 

i) 不 存在 如 下 形式 的 转换 : 对 于 任意 的 qe Q,x. ye AR de |L,R| ,9(q,,x) 2 [q,y,d]; 

iii) 不 存在 如 下 形式 的 转换 : B(q, B); 

iv) WAFER Au, RKf(u) =v, 那么 计算 在 格局 为 dfBvB 的 时 候 停机 ; 而 且 

v) RŠ flu) 1 ， 计 算 将 会 永远 进行 下 去 。 

如 果 存 在 一 个 能 够 计算 某 一 个 函数 的 图 灵机 ， 则 说 该 函数 是 图 灵 可 计算 的 (turing computable) o, 
当然 ,计算 函数 的 图 灵机 ， 在 输入 字符 串 为 u 的 时 候 也 有 可 能 会 失败 ， 在 这 种 情况 下 ， 函 数 f 则 对 
于 4 是 没有 定义 的 。 因 而 图 灵机 能 够 计算 全 函数 以 及 部 分 函数 。 

任意 的 一 个 函数 不 一 定 非 要 有 相同 的 定义 域 和 值 域 。 图 灵机 能 够 设计 成 为 计算 从 "到 某 一 个 特 - 
定 的 集合 R 的 函数 ， 其 中 输入 字母 表 是 五 ， 值 域 是 R。 条件 (iv) 可 以 被 解释 为 要 求 字符 串 v 是 R 的 
一个 元 素 5 

为 了 强调 图 灵机 的 特殊 状态 和 9， 能 够 计算 函数 的 图 灵机 应 该 由 下 面 类 似 的 图 进行 表示 : 


从 直觉 上 来 说 ， 计 算 将 一 直 在 标记 为 M 的 方 框 中 进行 计算 ， 
直到 终止 。 这 个 图 从 某 种 意义 上 来 说 有 些 过 于 简单 了 ， 因 为 定义 “go) 
9.1.1 允许 有 多 个 状态 转移 到 状态 q 以 及 从 qj 转移 出 去 。 然 而 ， 条 


(F (ui) 则 确定 了 当 图 灵机 在 扫描 一 个 空白 的 时 候 ， 没 有 任何 转移 状态 是 由 9 开始 的 。 当 这 种 情况 发 
生 的 时 候 ， 计 算 就 会 终止 ， 并 且 将 结果 写 到 带 上 。 
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例 9.1.1 图 灵机 





计算 了 从 fa,pj “到 |a,b} 的 部 分 函数 户 定义 如 下 : 
f (u) 4p (WR u LAE— a) 
T (其 他 情况 ) 

如 果 输 入 字符 串 中 不 包含 某 个 符号 a 的话 ， 那 么 该 函数 f 则 称 为 未 定义 的 。 在 这 种 情况 下 ， 图 灵 
机 在 状态 为 q 的 时 候 无 限 不 确定 地 向 右 移动 。 当 遇 到 符号 a 的 时 候 ， 图 灵机 则 会 进入 g RA, Wa 
继续 读 取 输 入 字符 串 的 剩 下 部 分 。 当 将 带 上 的 输入 字符 串 全 部 擦 除 并 返回 到 初始 位 置 的 时 候 ， 图 灵机 
的 计算 便 完 成 了 。 图 灵机 产生 格局 q,BB 并 结束 ， 从 而 指出 了 将 空 字符 串 作 为 计算 的 结果 。 口 

例 9.1.1 中 的 图 灵机 M 设计 用 来 计算 一 元 函数 Sy 当 输 入 字符 串 不 具备 我 们 所 期 望 的 形式 ， 且 图 灵 
BLM 的 计算 不 满足 定义 9. 1. 1 的 需求 的 时 候 ， 我们 既 不 用 吃惊 ， 也 不 用 惊慌 。 当 输入 字符 串 是 BbBbBaB 
时 ,图 灵机 M 结束 时 的 格局 是 BbBbqjB。 在 这 个 停机 的 格局 中 ， 带 上 并 没有 包含 一 个 值 ， 而 且 带 头 并 不 
在 正确 的 位 置 上 。 这 正 是 经 历 了 时 间 考 验 的 计算 机 科学 规律 “垃圾 进 ， 垃 圾 出 ”的 另 一 个 体现 。 

对 于 多 个 参数 的 函数 的 计算 也 很 类 似 。 输 入 字符 串 被 放置 在 磁带 上 ， 而 参数 则 使 用 空白 来 分 开 。 
某 三 元 函数 /输入 字符 串 为 aba、bbb 以 及 bab 时 ， 其 计算 的 初始 化 如 下 : 








如 果 faba,bbb,bab) 被 定义 ， 则 计算 终止 的 格局 是 gjBf( aba,bbb,bab)B。 而 函数 f(aa, 和 ,bb) 的 计算 的 
初始 格局 是 





带 上 连续 的 第 3 和 第 4 个 位 置 上 的 空白 说 明了 第 二 个 参数 是 空 字符 串 。 
例 9.1.2 图 灵机 
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计算 了 一 个 主要 用 来 连接 字母 表 | a,b| 上 面 的 字符 串 的 二 元 函数 。 图 灵机 计算 的 初始 格局 是 q,BuBvB, 
其 中 输入 字符 串 是 uw 和 v， 且 两 个 输入 字符 串 都 不 是 空 字符 串 。 
初始 的 字符 串 在 状态 q BURA, HRE a. 93. qs 和 gq, 形成 的 环 将 符号 a 向 左 移动 一 位 ， 同 样 
Hh, FH do. das q, 和 9 形成 的 环 将 符号 b 往 左 移动 一 位 。 这 些 环 一 直 循环 地 运行 直到 整个 第 二 个 参 
数 往 左 移动 一 位 ， 从 而 产生 格局 q,BuvB, T 
计算 函数 的 图 灵机 同样 能 够 用 来 接收 语言 。 语 言 工 的 特征 函数 (characteristic function) 是 这 样 的 
Pay: 10,1], EXT: 
Mave 
Xi GO) Pg Lot 
如 果 存 在 一 个 图 灵机 M 能 够 计算 x,， 则 语言 L 是 一 个 递归 语言 。 图 灵机 M 的 计算 结果 表明 了 是 否 接 
收 输入 字符 串 。 而 图 灵机 计算 如 下 的 部 分 特征 函数 
^ » Ium Wek 
ee uer 
则 表明 了 语言 L 是 递归 可 枚 举 的 。 练 习 2、 练 习 3 以 及 练习 4 提出 了 图 灵机 的 接收 语言 以 及 计算 语言 
的 特征 函数 之 间 的 等 价 性 。 


9.2 数值 计算 


我 们 可 以 看 到 图 灵机 能 够 用 于 计算 函数 的 值 ， 且 这 些 函 数 的 定义 域 和 值 域 都 是 根据 带 字母 表 生 成 
的 字符 串 。 在 本 节 中 ， 我 们 将 把 注意 力 转移 到 数字 计算 上 来 ， 尤 其 是 一 些 数论 函数 的 计算 。 数 论 函 数 
是 有 着 这 样 的 形式 的 函数 f: NxN x… x NN。 定 义 域 包含 n 元 组 的 自然 数 。 由 saln) =n’ 定义 的 函 
数 sq: NON 是 一 个 一 元 的 数论 函数 。 标 准 的 加 操作 与 乘 操 作 则 都 是 二 元 的 数论 函数 。 

从 符号 计算 到 数值 计算 的 转变 只 需要 改换 一 个 视角 ， 因 为 数字 是 由 符号 组 成 的 字符 串 来 代表 的 。 
图 灵机 的 输入 字母 表 是 由 计算 中 使 用 到 的 自然 数 的 代表 来 确定 的 。 我 们 使 用 自然 数 n 来 代表 字符 串 
1^, 数值 0 使 用 字符 串 1 来 代表 ， 而 数值 | 则 使 用 字符 串 11 来 表示 ， 依 此 类 推 。 这 种 符号 模式 被 认 
为 是 自然 数 的 一 元 表示 (unary representation) 。 自 然 数 n 的 一 元 表示 被 记 为 1。 当 数字 使 用 这 种 一 元 表 
示 来 编码 的 时 候 ， 计 算数 论 函数 的 图 灵机 的 输入 字符 串 是 只 有 一 个 元 素 的 集合 dll. i 

计算 三 元 数论 函数 1 (2,，0，3) 的 图 灵机 的 初始 机 器 格局 是 


propero rere 






WRS (2, 0, 3) =4， 则 计算 结束 时 的 格局 是 
一 个 个 变量 的 全 数论 函数 r: NxN x- x No 10, 1] Æ 
义 了 其 定义 域 上 的 一 个 大 元 的 关系 R， 这 个 关系 如 下 定义 : 
[mm m] ERE m,-,n) =1) 
[m ,m,,n]e€RCÉ r(n ,nj,°°',n,) =0) 


函数 > 则 被 称 作 关系 及 的 特征 函数 (characteristic function) 。 若 某 一 个 关系 的 特征 函数 是 图 灵 可 计算 
的 ， 则 该 关系 也 被 称 作 是 图 灵 可 计算 的 。 

现在 我 们 要 构造 几 个 图 灵机 来 计算 几 个 简单 但 是 很 重要 的 数论 函数 。 函 数 使 用 小 写字 母 来 表示 ， 
而 相应 的 图 灵机 则 使 用 大 写字 母 来 表示 。 后 继 函 数 为 s(n) =n +1 





WIR WIL 


S: B/B R A B/I L 
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FARA z(n) =0 
1/1 R IB L 
2 O B/BR A B/BL A B/BR O B/1L 
FIRRA eln) 1 
B/B R 
I/R 
E: X) B/B R A A 


图 灵机 在 计算 后 继 函数 的 时 候 仅仅 需要 在 输入 字符 串 的 右边 加 上 一 个 1。 零 函数 的 计算 则 是 擦 除 
输入 字符 串 并 且 在 带 的 第 一 个 位 置 写 上 字符 1。 空 函数 则 是 对 于 任何 参数 均 是 没有 定义 的 ， 图 灵机 在 
状态 gq, 时 无 穷 往 右 移动 。 

零 函 数 也 能 够 由 下 图 所 示 的 图 灵机 来 计算 。 


1/B R B/B L 


@) B/B R O 1/1 R e) B/B L @) VIL 


这 两 个 计算 同一 个 函数 的 图 灵机 描述 了 函数 以 及 算法 之 间 的 区 别 。 函 数 是 定义 域 中 的 元 素 到 值 域 中 的 
元 素 进 行 的 一 个 映射 。 只 要 函数 被 定义 好 了 ， 图 灵机 就 会 机 械 地 计算 函数 的 值 。 它 们 之 间 的 区 别 只 不 
过 一 个 是 定义 ， 另 一 个 是 计算 而 已 。 在 9.5 WP, 我们 将 会 看 到 有 些 数 论 函数 不 能 够 使 用 图 灵机 来 
计算 。 

k 个 变量 映射 函数 ps;” 的 值 被 定义 为 输入 字符 串 的 第 i 个 参数 ， 即 pi* (nj unus) =n E 
标 大 表示 参数 的 个 数 ， 而 下 标 则 指出 了 用 来 定义 映射 结果 的 参数 。 上 标 上 用 括号 括 起 来 的 原因 是 为 了 避 
免 被 认为 是 一 个 指数 。 而 图 灵机 计算 局 ” 则 只 是 将 第 一 个 参数 留 下 ， 而 将 剩 下 的 参数 全 部 擦 除 。 


I/IR 1/B R 1/B R B/B L IL 


po: © B/B R APT APT ... BBR A . IIL 


函数 pi” 仅仅 将 一 个 输入 字符 串 映 射 到 其 自身 。 这 个 函数 也 被 称 作 恒 等 函 数 (identity function) 
并 被 记 作 ido HA pj? 的 图 灵机 已 ” 将 在 例 9. 3. 1 中 提 及 。 
例 9.2.1 图 灵机 A 计算 自然 数 相 加 的 二 元 函数 。 
MIR I/I R MIL 


Ae (4) B/BR Orr AP (4) I/BL O I/BL 
对 于 自然 数 m 和 nn， 它们 的 一 元 表示 分 别 为 1 和 1""。 它 们 的 和 由 1" 来 表示 ， 现 将 两 个 参数 中 
间 的 空白 用 一 个 1 来 蔡 代 ， 然 后 在 第 二 个 参数 的 右边 氛 除 两 个 1， 就 生成 了 结果 字符 串 。 o 
19.2.2 前 驱 函 数 
0 =0 
m0 = {nt eme 


由 图 灵机 D 来 计算 
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如 果 输入 的 自然 数 大 于 0， 则 图 灵机 的 运算 过 程 中 会 将 带 的 最 右边 的 1 氛 除 。 口 
9.3 图 灵机 的 顺序 操作 


完成 单个 任务 的 图 灵机 能 够 被 合并 起 来 ， 从 而 构造 一 个 能 完成 复杂 任务 的 图 灵机 。 从 直观 上 来 
说 , 这 种 合并 往往 是 通过 将 图 灵机 顺序 运行 而 得 到 的 ， 即 一 个 图 灵机 计算 的 结果 成 为 下 一 个 图 灵机 计 
301) 算 的 输入 。 计 算 常 数 函 数 c(n) =1 的 图 灵机 能 够 通过 将 计算 零 函 数 的 图 灵机 与 计算 后 继 函 数 的 图 灵机 
合并 起 来 得 到 。 无 论 什么 输入 ， 当 图 灵机 和 Z 的 计算 终止 时 , 带 上 面 的 值 是 0， 然 后 根据 这 个 带 上 的 值 ， 
使 用 图 灵机 S 进行 计算 ， 就 能 够 产生 数字 1 T. 
如 果 图 灵机 Z 的 带头 在 位 置 零 ， 并 且 正 在 扫描 一 个 空白 ， 那 么 此 时 乙 终 止 ; 这 恰恰 是 图 灵机 S 的 
输入 条 件 。 定 义 9. 1. 工 中 介绍 的 初始 条 件 以 及 终止 条 件 正好 可 以 用 于 推进 这 类 计算 机 器 之 间 的 结合 。 
这 种 机 器 之 间 信 息 的 传递 是 靠 将 图 灵机 Z 的 终止 状态 标志 成 为 图 灵机 S 的 初始 状态 来 完成 的 。 除 了 他 
们 之 间 的 信息 传递 ， 这 两 个 图 灵机 的 状态 都 是 被 认为 有 区 别 的 。 可 以 将 每 个 状态 原来 所 在 的 机 器 名 字 
记 为 状态 的 下 标 从 而 来 保证 每 个 状态 之 间 的 区 别 。 





1/1 R I/BL 





这 两 个 图 灵机 的 顺序 组 装 能 够 用 下 面 的 图 表 来 表示 : 


从 初始 状态 到 终止 状态 的 节点 的 状态 名 均 被 省 略 了 ， 这 主要 是 因为 它们 都 来 自 以 前 所 在 的 子 图 灵机 。 
在 图 灵机 的 计算 中 ， 经 常会 遇 到 一 些 特 定 的 执行 顺序 。 图 灵机 能 够 被 构造 来 执行 这 些 重 现 的 任 
务 。 这 些 图 灵机 被 设计 成 能 够 作为 在 一 些 极为 复杂 的 图 灵机 中 运行 的 构件 的 形式 。 借 一 个 汇编 语言 
术语 来 说 ， 我 们 把 那 种 仅 执行 单一 任务 的 图 灵机 称 为 宏 〈macro) 图 灵机 。 
宏图 灵机 的 运算 遵循 定义 9. 1. 1 中 的 几 个 约束 。 初 始 状态 qo 严格 地 用 来 初始 化 整个 计算 。 由 于 这 
些 宏图 灵机 能 被 组 合成 更 为 复杂 的 图 灵机 ， 所 以 我 们 并 不 假定 在 每 次 运算 时 带头 都 一 定 都 在 第 0 个 位 
B02] 置 ， 但 是 我 们 可 以 假定 图 灵机 以 扫描 一 个 空白 来 表示 图 灵机 开始 一 个 新 的 运算 。 根 据 操作 ， 带 上 紧 临 
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带头 左边 或 者 正 右边 的 部 分 将 会 在 计算 中 被 扫描 到 。 一 个 宏图 灵机 将 会 包含 几 个 状态 ， 其 中 一 个 运算 
可 能 会 终止 。 与 能 够 计算 函数 的 图 灵机 相 比 ， 宏 图 灵机 是 不 允许 存在 从 终止 状态 qj 开始 且 形 如 5( qj， 


B) 的 状态 转换 的 。 IIR 


同 种 类 型 的 宏图 灵机 往往 被 描述 成 为 一 个 模式 。 宏 图 灵机 MR, 
表示 将 带头 往 右 移动 经 过 i 个 连续 的 自然 数 (1 的 连续 序列 )。 宏 图 IO: a 
灵机 MR, 如 右 图 所 示 。MR, 则 通过 添加 状态 使 得 带头 往 右 移动 连 | 
续 的 上 个 自然 数 。 
` DLE VIR IR MIR 


Of APT APT Ls m B/B R 


这 种 移动 的 宏图 灵机 并 不 影响 带头 所 在 初始 位 置 左边 的 带 。 安 图 灵机 MR, 的 运算 的 初始 状态 格局 是 
Bn,qjBn;Bn,Bn,B, WARS ate B n B nB n,qjB nj B, 

宏图 灵机 ， 除 了 输入 字符 串 有 一 个 特殊 的 形式 以 外 ， 其 他 都 与 计算 函数 的 图 灵机 一 样 。 向 右 移动 
的 宏图 灵机 MR, 需要 在 图 灵机 的 初始 状态 的 时 候 ， 带 上 带头 右边 的 部 分 至 少 要 有 i 个 自然 数 的 序列 。 
这 种 组 装 图 灵机 的 设计 要 求 每 一 个 宏图 灵机 都 必须 有 恰好 的 输入 格局 。 

几 类 宏图 灵机 通过 描述 图 灵机 计算 的 结果 来 定义 。 每 一 个 宏图 灵机 的 运算 在 带 上 的 表示 就 是 初始 
以 及 终止 状态 的 空白 符号 。 该 宏图 灵机 的 运算 将 不 会 访问 或 者 更 改 两 端的 限度 之 外 的 任何 数据 。 带 头 
所 在 的 位 置 将 会 用 下 划 线 表示 ， 而 双向 的 箭头 表示 了 在 运算 前 和 运算 后 相同 的 带 位 置 。 

ML, (向 左 移动 ) : 

B n,B n,B---B n,B k>0 


| | 


Bn,B n,B---B n,B 


FR (发 现 右边 ) 
BB'nB i>0 
1 
B'BnB 
FL (发 现 左 边 ) \ 
B nB'B i>0 
Jag 
BnB'B 
E, (KR) 
BnBnB-BnB kzl 
| | 
BB PC BB 
CPY, (复制 ) 


BnBnB-Bn,BBB-.BB kzl 
Bn,B n,B--B n,B n,B n,B---B n,B 
CPY,, (复制 i 个 数字 ) 
BnBnB-BnBn,--Bn,BB = BB kzl 


| | | | 


BnBnB-BnBn,:-Bn,BnBnB +B nB 








[304] 
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T (翻译 ) 
BB' nB iz0 


Lll 
BnB'B 
用 于 寻找 的 宏图 灵机 将 带头 往 右 或 者 往 左 移动 到 恰好 能 够 访问 第 一 个 自然 数 的 位 置 而 E, WERT k 
个 连续 自然 数 之 外 ， 还 将 带头 停留 在 其 最 初 的 位 置 。 
用 于 复制 的 宏图 灵机 产生 了 指定 的 整数 数字 拷贝 ， 用 于 产生 拷贝 的 带 段 事先 必须 是 空白 。CPY，， 
则 需要 连续 的 上 +i 个 整数 后 面 紧 跟着 的 空白 带 是 足够 长 的 ， 以 便 能 够 产生 最 初 的 大 个 数字 的 拷贝 。 而 
用 于 翻译 的 宏图 灵机 则 将 第 一 个 自然 数 的 位 置 更 改 到 带头 的 右边 ， 然 后 当 其 带头 在 计算 初始 的 位 置 
时 ,计算 终止 ,并 且 翻 译 好 的 字符 串 恰 在 带头 的 右边 。 
BRN 宏 自 动机 有 两 个 可 能 的 终止 状态 ， 宏 BRN 的 
输入 ， 它 是 一 个 自然 数 ， 用 于 选择 该 宏图 灵机 终止 的 状 
态 ， 宏 图 灵机 如 右 图 所 示 。 宏 图 灵机 BRN 的 计算 并 不 
会 改变 带 上 的 数据 也 不 会 改变 带头 的 位 置 。 实 际 上 ， 它 
能 够 在 任意 形 如 BnB8 的 格局 下 运行 。 这 个 宏 往往 用 于 复 
杂 的 图 灵机 中 循环 的 构造 以 及 从 两 者 中 选择 一 个 分 支 的 
计算 中 。 
更 多 的 宏图 灵机 均 能 够 使 用 这 些 以 及 预先 定义 的 宏图 灵机 来 构造 。 图 灵机 








交换 两 个 数字 的 顺序 ， 这 个 图 灵机 的 带 格局 是 INT (交换 ) 
Bn B mBB"*'B 


| | 
Bm B nBB"*'B 
在 练习 6 中 ,将 会 要 求 读者 使 用 宏图 灵机 INT 来 构造 一 个 图 灵机 ， 并 且 在 计算 的 过 程 中 不 离开 带 片 断 
BnBmB, : 
例 9.3.1 图 灵机 用 于 评价 映射 函数 pi” 的 运算 ,这 包括 三 个 不 同 的 动作 : 擦 去 初始 的 i-1 个 参 
数 ， 将 第 i 个 参数 移动 到 带 位 置 1 的 地 方 ， 然 后 擦 除 输 入 字符 串 剩余 的 部 分 。 用 于 计算 p” 的 图 灵机 
可 以 使 用 宏图 灵机 FR、FL、E,、MR, 以 及 TT 来 设计 6 


o4 Fer edelo4n ode odio 。 


在 设计 复杂 图 灵机 的 时 候 ， 用 于 计算 函数 的 图 灵机 同样 能 像 宏 图 灵机 一 样 使 用 。 但 和 宏图 灵机 的 
运算 不 同 的 是 ， 在 这 样 一 个 函数 图 灵机 的 运算 中 ,没有 前 述 的 那些 宏图 灵机 所 需要 的 带 上 的 边界 。 而 
AL, 这 些 图 灵机 只 有 在 输入 字符 串 后 面 全 部 是 空白 带 时 才能 运行 。 

例 9.3.2 宏图 灵机 以 及 前 面 构造 的 图 灵机 能 用 来 设计 一 个 能 够 计算 f(n) =3n 的 图 灵机 。 





使 用 例 9. 2. 1 里 面 的 图 灵机 A 进行 构造 ， 并 添加 了 两 个 自然 数 。f(n) 将 完成 拷贝 的 宏和 机 器 A 结合 在 
一 起 ， 从 而 产生 n 的 三 个 拷贝 。 输 入 字符 串 使 4 的 运算 产生 了 下 面 的 带 格 局 。 
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图 灵机 格局 
BnB 





CPY, BnB nB 


MR; B nBnB 





CPY, B nBRB nB 
A BnBn+nB 
ML, BnBn+nB 


A Bn+n+nB 


要 注意 的 是 ,图 灵机 A 里 的 加 法 ,只 有 当 参 数 是 带 最 右边 的 编码 数字 的 时 候 才 会 运行 。 口 

例 9.3.3 仅 有 一 个 变量 的 常数 函数 0 定义 为 z(n) =0, 其 中 neN, 能 够 使 用 宏图 灵机 BRN( 如 上 
图 所 示 ) 以 及 图 灵机 D 来 构造 ,其 中 D 是 前 趋 函 数 。 口 

例 9.3.4 图 灵机 MULT 构造 用 于 计算 自然 数 的 乘法 。 当 设计 这 样 一 个 复杂 的 图 灵机 的 时 候 ,可 


以 将 宏图 灵机 与 标准 图 灵机 的 转换 结合 在 一 起 。 宏 图 灵机 初 
始 状态 的 格局 决定 了 当 在 任意 状态 扫描 空白 的 时 候 都 能 够 进 OO 
入 子 图 灵机 。 当 状态 为 q 时 ,宏图 灵机 M. 的 初始 状态 的 辨别 


表示 如 右 图 所 示 。 由 于 宏图 灵机 只 有 在 扫描 空白 符号 后 才能 够 进入 ,所 以 当 图 灵机 状态 为 9;, 但 却 扫描 
的 不 是 空白 符号 时 ,同样 需要 定义 一 些 状态 转换 的 函数 。 307 








[309] 
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如 果 第 一 个 参数 为 0, 则 运算 中 会 擦 除 第 二 个 参数 ,并 且 返 回 到 初始 状态 ,并 且 停 机 。 否则 的 话 , 图 
灵机 MULT 的 运算 就 是 将 mm 与 其 自身 相 加 次。 加 法 是 先 拷贝 而 然后 将 这 个 拷贝 加 到 前 面 的 结果 中 
去 ,循环 次 数 的 记录 则 是 当 一 次 拷贝 结束 了 ,就 将 第 一 个 参数 中 的 1 ffs X. L1 
9.4 函数 的 合成 - 

如 果 使 用 函数 的 另外 一 种 解释 一 一 从 定义 域 到 值 域 的 映射 一 的话 ,可 以 使 用 下 面 的 图 表 来 表示 
一 元 数论 函数 g 和 


g h 


QE OA CES CS 


而 从 N 到 N 的 映射 则 可 以 通过 确认 e 的 值 域 以 及 有 h 的 定义 域 ; 然 后 更 改 图 表 中 的 箭头 来 获取 。 
g h 


o O 


通过 这 种 合并 获得 的 函数 叫做 函数 h 和 函数 8 的 合成 。 在 定义 9. 4. 1 中 有 一 元 函数 的 合成 的 形式 化 定 
义 。 而 定义 9.4. 2 中 则 扩展 到 n- 元 函数 。 
定义 9.4.1 设 8 和 户 是 一 元 数论 函数 。 函 数 灵 和 8 合成 产生 的 HA f:NoN 定义 如 下 : 


1 # g(x) T 
f(x) :| 1 # g(x) =y Hh(y) t 
h(y) # g(x) =y Hh(y) | 


合成 的 通 数 被 记 作 f=hog。 

如 果 输 入 是 x, 则 合成 函数 1= hog 的 值 被 写成 x) =h(g(x))。 值 h(g(x)) 有 定义 当 且 仅 当 g(x) 
有 定义 且 h HF e G0 的 值 也 有 定义 。 而 且 ,全 函数 的 合成 也 会 产生 一 个 全 函数 。 

从 可 计算 的 角度 来 看 ,hog 的 合成 包含 了 对 函数 g 和 有 的 顺序 上 的 考虑 。 函 数 g 的 计算 结果 为 函数 
提供 了 输入 (如 右 图 所 示 )。 函 数 的 合成 有 定义 仅 当 计算 的 顺序 使 得 计算 能 够 正确 的 结束 。 

定义 9.4.2 设 g,8,,…,g， JE — ^v k - ARH gh Eh X — n- AK 输入 
论 函 数 , 而 上 -元 函数 的 定义 如 下 : 

TG XI 3 XE) =h(g, x, om xL) 5*5 85 X y XL) 

它 被 称 为 h 和 g,, 8,, +, g, 的 合成 (composition), FRE m f-he(g,, 
£74) 。 该 函数 7 ,zi ) 是 没有 被 定义 的 ， 如 果 ia 

i) #2 1<i<n, E07) | Rae 

ti) g(x,,",x) zy, HP l<isn B h(y,,---,y,) ts 


通常 函数 合成 的 定义 也 有 一 些 可 计算 性 的 解释 。 输 入 参数 被 提供 给 每 一 se) 
个 函数 g;， 而 这 些 函 数 则 生成 函数 h 的 参数 。 
例 9.4.1 考虑 如 下 合成 函数 定义 的 映射 : 
(3) (3) (3) 计算 
addo( c5" ,adde( pj ps 238 
其 中 add(n,m) 2n « m, cy” Œh cP (nj, ,n,) =2 所 定义 的 三 元 常数 函 


数 。 此 合成 是 一 个 三 元 函数 的 合成 ， 从 最 里 层 的 函数 合成 开始 ， 那 些 直接 需 
要 使 用 输入 的 函数 都 是 要 有 三 个 参数 的 。 此 函数 将 第 一 个 和 第 三 个 参数 相 “结果 h (g(x)) 
加 ， 再 与 第 二 个 常数 相 加 。 输 入 参数 是 1、0 和 3 ， 函 数 的 计算 结果 是 
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addo(c ,addo( p\” ,pt ) ) (1,0,3) 
= addo (cj? ,(1,0,3) ,adde( pj? ,pl ) (1,0,3)) 
| z add(2 ,add( pj? (1,0,3) ,p (1,0,3))) 
= add(2 ,add(1,3) ) 
- add(2,4) 
='6. m 
如 果 一 个 函数 是 通过 组 合 图 灵 可 计算 函数 来 合成 的 话 ， 那 么 其 本 身 也 是 图 灵 可 计算 的 。 这 个 论点 
是 构造 性 的 ， 某 个 图 灵机 通过 合并 能 够 计算 构成 函数 以 及 宏图 灵机 ， 从 而 被 设计 成 为 能 够 计算 合成 函 
数 的 图 灵机 。 
Bg Ae, 是 三 元 图 灵 可 计算 函数 ， 并 且 设 hh 是 一 个 两 元 图 灵 可 计算 函数 。 由 于 ig1、g, MAME 
图 灵 可 计算 的 ， 因 此 存在 能 够 计算 这 些 函 数 的 图 录 机 G, 、G; 以 及 H, sit sig n, fin, 
计算 合成 函数 ho( g, ,8; ) 的 过 程 具体 如 下 。 














机 器 格 局 

Bn, B mB mB 
CPY, BnBnBn,BnBnBnB 
MR, Bn,B nB n,Bn,B-n,B n,B 
G, BnjBnBn,Bgy(n,n,n) B 
ML, Bn,B n,B n,B g, (n; nj ,n,) B 
PY; Bn,B mB njB g, (n, n; ,n,) B n,B n,B nB 
MR, B n,B mB mB g,(n,,n,,n,) Bn, B n;Bn,B 
G, B n,B mB mB a mm) B 830m „m,m JB 
ML, B n,B n,B n,Bg, (nj n; n) B gy (nj n; ,n;) B 
H B nj B nB nBh(g, (n, n; n) ,82 (nj „m ,73 ) ) B 
ML, Bii, B nB n5 B WCB Cm as) „82 n „m 8) B 
E, BB: B h(g, (n, jn n3) ga Ci n5 n4) )B 
T Bh( gy (n, ,n; mj) 582 (nj mj n) )B 


计算 中 首先 复制 了 输入 参数 ， 并 且 使 用 函数 8 计算 了 这 些 新 产生 的 参数 拷贝 的 值 s 由 于 图 灵机 'Gi 并 
不 会 移动 到 初始 位 置 的 左 侧 ， 所 以 初始 的 输入 保持 不 变 。 如 果 g (n; nn, ) 是 未 被 定义 的 ; WA RAL 
G, 的 运算 会 无 穷 进行 下 去 。 在 这 种 情况 下 ， 整 个 图 灵机 的 运算 就 不 能 停止 ， 从 而 也 就 正确 地 表示 
h(g, (n, n n4) ,8 (nj ,n;,n,) ) 也 是 未 被 定义 的 。 在 G 正确 停止 的 基础 之 上 ,输入 再 次 被 复制 ， 然 后 
图 灵机 G, 才能 开始 利用 这 些 拷贝 ， 进 行 下 面 的 计算 。 

若 gi (n,m n, ) All g,(n, n, ,nm ) 均 为 有 定义 的 ， 则 图 灵机 G, 也 能 够 根据 其 输入 正确 终止 ， 且 此 时 
带 上 面 留 下 的 就 是 图 灵机 H 所 需要 的 输入 。 然 后 图 灵机 H 就 开始 计算 hlg (ni n; n) ,gy (n ,n,n ))。 
当 图 灵机 H 的 计算 终止 后 ， 计 算 结 果 将 会 被 转移 到 正确 的 位 置 。 

上 述 的 构造 过 程 能 够 很 容易 的 产生 任意 元 的 函数 的 合成 ， 从 而 产生 了 下 面 的 定理 9.4.3。 

定理 9.4.3 图 灵 可 计算 函数 在 合成 操作 上 是 封闭 的 。 

定理 9. 4. 3 能 用 来 解释 某 一 个 函数 是 图 灵 可 计算 的 ， 而 并 不 需要 清楚 地 构造 一 个 能 够 计算 该 函 
数 的 图 灵机 。 如 果 了 能 够 用 图 灵 可 计算 函数 的 合成 来 定义 ,那么 根据 定理 9.4.3, f 也 是 图 灵 可 计 
算 的 。 

例 9.4.2 大 元 常数 函数 cf” ， 其 值 由 ch (n,e) =i 来 定义 ， 是 图 灵 可 计算 的 。 函 数 c” 可 由 
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(EY r. ve (k) 
Ci = SoSo oSoZop, n 


i times 

来 定义 。 这 个 映射 函数 接受 上 个 变量 作为 输入 ， 并 且 将 第 一 个 参数 传 给 零 函 数 ， 然 后 使 用 i 个 后 继 函 
数 的 合成 产生 了 所 需要 的 值 。 由 于 合成 的 每 一 个 函数 都 是 图 灵 可 计算 的 ， 因 此 根据 定理 9.4.3， 函 数 
c 也 是 图 灵 可 计算 的 。 回 

例 9.4.3 二 元 函数 smsq(n,m) =n +m 是 图 灵 可 计算 的 。 这 个 求 平方 和 的 函数 能 够 写成 下 面 的 
函数 的 合成 : 

smsq = addo( sqop;^ ,sqops”) ， 

其 中 sq 被 定义 为 sg(n) = 天 。 用 于 加 法 的 函数 则 是 由 例 9. 2. 1 中 构造 的 图 灵机 来 实现 的 ， 而 sg 则 是 由 
下 图 所 示 的 图 灵机 来 实现 的 。 


om © -© 


m 
9.5 不 可 计算 函数 


一 个 函数 是 图 灵 可 计算 的 当 且 仅 当 存 在 一 个 可 以 计算 该 函数 的 图 灵机 。 已 经 存在 的 非 图 灵 可 计算 的 
数论 函数 能 够 使 用 一 个 简单 的 计数 参数 来 描述 。 我 们 这 就 开始 说 明 可 计算 函数 的 集合 是 可 数 无 穷 大 的 。 

图 灵机 是 完全 由 其 转换 函数 来 定义 的 。 图 灵机 的 状态 以 及 计算 过 程 中 出 现 的 带 字母 表 均 能 够 从 状 
态 转换 中 提取 出 来 。 设 图 灵机 M AM, 如 下 定义 。 


LBR B/B L B/I L 


M,: CSI BI GAA i art qs o 


L/B R B/B L IL 


M Ot: GH APT A Qu 


图 灵机 M, 和 M 都 能 够 计算 一 元 常数 函数 cl 。 这 两 个 图 灵机 的 区 别 仅仅 是 状态 的 名 字 以 及 在 计算 中 
标记 的 名 字 。 这 些 符 号 对 于 计算 的 结果 以 及 该 图 灵机 能 够 计算 的 函数 没有 任何 影响 。 

由 于 状态 的 名 字 以 及 带 符号 (RT BAI) 都 是 非 实质 的 ， 因 此 我 们 采用 下 面 的 约定 来 考虑 图 灵 
机 中 的 元 素 的 命名 : 

i) 状态 的 集合 是 0, = [q | i20] 的 一 个 有 限 子 集 。 





i) 输入 字母 表 是 11| 。 
di) 带 字母 表 是 集合 To = |B,1,X,| 这 0 的 一 个 有 限 子 集 。 
iv) 初始 的 状态 是 qo。 [g, x » d q]. 
图 灵机 的 状态 转换 使 用 函数 表示 法 来 标识 ; 当 状 态 为 q 且 带 符号 是 x 

时 ， 状 态 转 换 被 记 为 6(q;,x) = [gj,y,d]。 这 些 信息 也 能 够 用 五 元 组 来 表 xU | 

示 。 使 用 如 前 所 述 的 命名 规则 ， 图 灵机 的 一 个 状态 转换 是 集合 T= Q, x T, 扫描 的 字符 

xT, x {L,R} xQ, 的 一 个 元 素 。 由 于 集合 T 是 可 数 集合 的 笛 卡 尔 积 ， 则 工 BS A MU 

也 是 可 数 的 。 方向 
确定 型 图 灵机 的 状态 转换 形成 集合 T 的 一 个 有 限 子 集 ， 其 中 每 一 个 元 新 状态 


素 的 最 初 两 个 部 分 是 有 区 别 的 ; 这 样 的 子 集 只 有 可 数 个 ， 从 而 也 就 说 明了 
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图 灵 可 计算 函数 的 个 数 最 多 就 是 可 数 无 穷 大 的 5 从 另 一 方面 来 说 ， 图 灵 可 计算 函数 的 数目 最 少 也 是 可 
数 无 穷 大 的 ， 这 主要 是 因为 有 众多 的 常数 函数 ， 由 例 9.4.2 知 ， 它 们 也 都 是 图 灵 可 计算 的 。 上 述 这 些 
说 明 引 出 了 定理 9. 5.1, 

定理 9.5.1 图 灵 可 计算 的 数论 函数 的 集合 是 可 数 无 穷 大 的 。 

在 1.4 节 中 ， 对 角 化 技术 被 用 于 证 明 存 在 无 穷 多 的 一 元 数论 全 函数 ， 结 合 定理 9.5.1， 我 们 可 以 
得 出 推论 9.5.2。 

推论 9.5.2 存在 一 个 一 元 数论 全 函数 ， 且 它 不 是 图 灵 可 计算 的 。 

推论 9.5. 2 轻描淡写 地 描述 了 可 计算 和 不 可 计算 方程 之 间 的 关系 。 前 者 组 成 了 一 个 可 数 的 集合 ， 
而 后 者 则 组 成 了 一 个 不 可 数 的 集合 。 


9.6 关于 编程 语言 


高 级 编程 语言 在 可 计算 系统 中 被 十 分 广泛 地 和 运用。 程序 定义 了 机 械 和 确定 型 的 过 程 ， 以 及 算法 的 
计算 特点 。 直 觉 上 看 ， 用 程序 语言 写 并 且 运 行 在 计算 机 中 的 程序 ,能 够 用 图 灵机 来 模拟 ， 这 依靠 的 仅 
是 机 器 指令 更 改 了 内 存 中 部 分 位 置 的 部 分 比特 而 已 。 这 恰恰 是 图 灵机 所 能 够 执行 的 操作 ， 即 在 内 存 中 
写 1 或 者 0。 虽 然 说 需要 很 多 次 的 状态 转换 才能 够 完成 这 个 任务 ， 但 这 并 不 难 让 我 们 想象 到 ， 连 续 的 
状态 转换 能 够 访问 正确 的 位 置 并 且 重 写 内 存 中 的 内 容 。 

在 本 节 中 ， 我 们 将 会 仔细 地 探讨 一 下 ， 使 用 图 灵机 的 体系 结构 作为 高 级 语言 的 底层 框架 的 可 能 
性 。 基 于 图 灵机 体系 结构 的 编程 语言 的 发 展 ， 更 深层 次 地 描述 了 图 灵机 模型 的 能 力 。 在 描述 汇编 语言 
时 ， 我 们 使 用 图 灵机 以 及 宏图 灵机 来 定义 其 中 的 操作 。 本 节 的 目的 并 不 是 创造 一 个 功能 性 的 汇编 语 
言 ， 而 是 描述 图 灵机 体系 结构 的 普遍 适应 性 。 

标准 图 灵机 提供 的 可 计算 的 框架 ， 在 本 节 中 均 有 涉及 。 我 们 将 会 设计 一 种 汇编 语言 TM， 从 而 
为 图 灵机 体系 结构 与 编程 语言 之 间 建 立 一 个 跨越 它们 鸿沟 的 桥梁 。 这 种 汇编 语言 的 第 一 个 目标 就 是 
提供 对 于 图 灵机 动作 的 一 个 顺序 描述 。 图 灵机 的 “程序 流 ” 是 由 图 灵机 状态 图 中 的 弧 来 表示 的 。 汇 
编 语 言 程序 的 流 则 由 指令 的 顺序 执行 组 成 ， 除 非 这 种 模式 被 某 个 重 定向 流 的 指令 特定 地 改变 了 。 在 
汇编 语言 中 ， 分 支 以 及 goto 指令 都 用 来 改变 顺序 程序 流 ， 而 汇编 语言 的 第 二 个 目标 是 提供 简化 内 存 
管理 的 指令 。 

图 灵机 的 底层 体系 结构 用 来 评估 汇编 语言 程序 (参见 图 9-1)。 输 入 值 被 赋 给 变量 vy, ，…，v， 而 
Vas c. v, 则 是 程序 中 的 局 部 变量 。 变 量 的 值 被 顺序 存储 并 且 使 用 空格 分 开 。 输 入 变量 在 图 灵机 计 
算 函 数 时 位 于 标准 输入 位 置 。 一 个 TM 程序 开始 于 声明 程序 中 要 用 到 的 局 部 变量 。 每 一 个 局 部 变量 在 
计算 开始 之 前 都 被 初始 化 为 0。 


BY, BY, B... BY, B7, B... B BBBB 
i cM Sift eek ee Ae oe aso 
输入 变量 局 部 变量 l 寄存 器 与 工作 区 


始 位 置 
图 9-1 用 于 高 级 计算 的 图 灵机 结构 


当初 始 化 完成 后 ， 带 头 停 在 变量 与 带 剩 余 空白 之 间 的 空白 处 ， 这 个 地 方 被 称 为 中 心 位 置 (home 
position) 。 在 每 两 条 指令 的 运行 之 间 ， 带 头 都 会 返回 到 中 心 位 置 。 在 中 心 位 置 的 右边 是 图 灵机 里 的 寄 
存 器 。 中 心 位 置 右边 的 第 一 个 值 被 当 作 寄存 器 1 的 值 ， 第 二 个 值 是 寄存 器 2 的 值 ， 依 此 类 推 。 寄 存 器 
的 值 也 必须 被 顺序 赋值 ， 也 就 是 说 ， 第 ;个 寄存 器 能 够 被 读 或 写 当 且 仅 当 寄存 器 1，2，…,1i -1 都 已 
经 被 分 配 了 相应 的 值 。 在 表 9-1 中 给 出 了 汇编 语言 TM 的 指令 。 
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9-1 TM 指令 

TM 指令 "m X 
INIT v, 把 局 部 变量 w 初始 化 为 0 
HOME: 当 上 变量 被 分 配 后 ， 将 带头 移动 到 中 心 位 置 
LOAD v,, t 将 变量 v; 的 值 装载 到 寄存 器 1 
STOR v;, t 将 寄存 器 t 中 的 值 存储 到 v, 的 地 址 
RETURN v, 删除 变量 ， 并 把 变量 v; 的 值 保留 在 输出 位 置 
CLEAR: 删除 寄存 器 上 中 的 值 
BRNL, t 


INC: 
DEC: 
ZEROt 


如 果 寄存 器 上 的 值 是 0 则 转移 到 标记 为 工 的 指令 
执行 标记 为 工 的 指令 

无 操作 (与 GOTO 命令 结合 使 用 ) 

增加 寄存 器 上 的 值 

减 小 寄存 器 1 的 值 

用 0 替换 寄存 器 上 中 的 值 





带 初始 化 的 完成 使 用 了 INIT 以 及 HOME 命令 。INIT v, 保存 了 局 部 变量 v, 
的 位 置 ， 并 且 将 其 赋值 为 0。 由 于 变量 在 带 上 面 被 顺序 存储 ， 则 本 地 变量 必须 在 


TM 程序 初始 的 时 候 被 顺序 初始 化 。 当 本 地 变量 的 初始 化 完成 之 后 ，HOME 指 
令 即 将 带头 移动 到 中 心 位 置 ， 这 些 指令 的 定义 如 右 表 所 示 。 


其 中 ZR 是 在 带头 位 置 正 右边 写 值 0 的 宏图 灵机 (练习 6)。 一 个 有 着 一 个 


HOME: 


输入 参数 以 及 两 个 局 部 变量 的 初始 化 过 程 ， 将 会 产生 如 右 表 所 示 的 图 灵机 格 


局 。 其 中 是 该 计算 中 输入 参数 的 值 。 带 头 所 在 的 位 置 使 用 下 划 线 进行 标记 。 


fr TM 中 ，LOAD 和 STOR 指令 用 来 访问 以 及 存储 变量 的 值 。 这 些 指令 
的 目标 是 使 得 内 存 管理 对 于 用 户 来 说 是 透明 的 。 在 图 灵机 中 并 没有 给 出 带 数 
量 的 上 边界 ， 而 这 部 分 带 则 有 可 能 被 要 求 存储 变量 的 值 。 由 于 分 配给 每 一 个 


变量 的 带 位 置 的 数量 并 没有 被 预先 分 配 好 ， 因 此 会 使 得 图 灵机 的 内 存 管理 变 
得 十 分 的 复杂 。 这 种 忽略 其 实 是 有 目的 的 ， 即 ， 为 了 给 予 图 灵机 计算 最 大 的 
灵活 性 。 那 种 常用 的 编译 器 所 给 出 的 标准 方法 


HOME3 





对 于 每 个 变量 分 配 一 个 固 


定 大 小 的 内 存 一 一 会 导致 在 需要 存储 的 值 超过 预 分 配 大 小 内 存 时 的 溢出 错误 。 

STOR 指令 取出 寄存 器 1 中 的 值 并 存储 到 特定 的 变量 位 置 中 。 这 条 命令 仅 用 于 当 t 是 具有 分 配 的 值 
的 最 大 寄存 器 。 在 将 寄存 器 1 的 值 存储 到 变量 v, 中 时 ， 必 须 维护 所 有 变量 的 正确 的 空间 。 图 灵机 在 实 
BR STOR 命令 的 时 候 主 要 使 用 了 宏图 灵机 INT， 从 而 能 够 将 值 从 寄存 器 中 移动 到 正确 的 位 置 。 宏 图 灵 
机 INT 被 假定 为 停留 在 带 片断 BxB yB 中 (练习 6)。 





命令 STOR 如 下 定义 : 
指令 定义 
ML n-i+l 
STOR v,, 1 ( | 
INT 
MR, " 
eg 
MR, 


指令 定义 


定义 
MR,., 
ZR 
ML,., 
MR, 


格局 

BiB 

BiB 0B 
BiB 0B 0B 
Bi BÜBOB 





STOR v,, t MR, > 


fe 


(or 


t+n-i-1 


t*n-i-l 
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其 中 +>1 且 n 是 输入 参数 以 及 局 部 变量 的 总 数 ， 指 数 n-i+1 和 ni 指出 了 宏图 灵机 的 循环 次 数 。 当 


寄存 器 t 的 值 被 保存 后 ， 寄 存 器 被 擦 除 。 
在 图 灵机 执行 指令 STOR v, 所 得 到 的 格局 中 ,追踪 1 从 而 来 显示 
在 TM 的 内 存 管 理 中 宏图 灵机 的 角色 。 在 执行 指令 之 前 ， 带 头 在 中 心 


2 位 置 。 


图 灵机 对 LOAD 指令 的 实现 仅仅 是 通过 拷贝 变量 v, 的 值 到 特定 
的 寄存 器 中 来 实现 的 。 


指令 定义 
LOAD v,, t ML, -i41 
CPY, , iui +t 
MR 


n-i+l 


前 面 提 到 ， 将 一 个 值 加 载 到 寄存 器 1 中， 需要 寄存 器 1, 2, …, t-l 
都 已 经 被 填 满 了 。 因 而 ,为 了 指令 LOAD v, 的 正确 执行 ,图 灵机 一 
定 处 于 下 面 的 状态 


Bv, Bv, B ... Bv, Bv, B... Bv, Br, Br, B ... 


指令 RETURN 5j CLEAR 重新 配置 了 带 从 而 获得 计算 的 结 
果 。 如 果 当 指令 RETURN v 运行 时 ， 带 头 处 于 中 心 位 置 ， 并 且 
没有 任何 寄存 器 被 占用 的 话 ， 则 带 被 重 写 ， 并 且 将 v, 的 值 写 到 
图 灵机 输出 的 位 置 上 。CLEAR 指令 则 是 仅 将 寄存 器 中 的 值 删除 。 

代数 操作 修改 寄存 器 中 的 值 。INC、DEC 以 及 ZERO 依次 用 
后 继 图 灵机 、 前 驱 图 灵机 以 及 零 图 灵机 来 定义 。 为 了 汇编 语言 
TM 所 定义 的 其 他 代数 操作 ， 可 以 通过 创建 新 的 图 灵机 来 实现 。 
比如 说 ， 汇 编 语言 中 指令 ADD 能 够 使 用 例 9. 2. 1 中 可 以 实现 加 
法 的 图 灵机 A 来 定义 ， 那么 指令 ADD 则 能 够 将 寄存 器 1 和 寄存 
器 2 中 的 值 相 加 ， 并 且 将 结果 存储 在 寄存 器 1 中 。 既 然 我 们 能 够 
通过 增加 更 多 的 代数 操作 来 大 量 增加 汇编 语言 的 指令 数 ， 那 么 
INC, DEC 以 及 ZERO 对 于 开发 语言 的 目的 来 说 就 是 足够 的 了 。 


汇编 语言 指令 的 执行 包括 定义 每 条 指令 的 图 灵机 和 宏图 灵机 的 顺序 操作 。BRN 以 及 GOTO 指令 
则 打破 了 这 种 顺序 执行 ， 因 为 它们 可 以 明确 地 指定 下 一 条 要 执行 的 指令 。GOTO L 指出 了 标记 为 工 的 
指令 将 是 要 执行 的 下 一 条 指令 。 分 支 指令 BRN L，t， 在 指出 下 一 条 顺序 执行 的 指令 之 前 会 测试 寄存 
器 !， 如 果 寄 存 器 中 的 值 不 是 0， 则 这 个 分 支 指令 下 面 紧 挨 着 的 指令 就 是 下 一 条 要 被 执行 的 ， 否 则 ， 标 





图 灵机 格局 
Bv,BvBv,BrB 
ML, BwBv;Bv,B rB 
INT Bv Bv,BrB B 
ML, Bv,Bv,B rB v,B 
INT B v, BrBvB vB 
MR, By, BrBv;B vB 
INT B v, Br Bv,B v,B 
MR, Bv B rB v,By,B 
E, Bv, B rB v,BB 
Br, B 
指令 定义 
RETURN v; ML, 
E;., 
T 
MR, 
FR 
E.l +1 
FL 
CLEARt MR,_, 
E, 
ML, 


志 为 工 的 指令 为 下 一 条 要 被 执行 的 。 图 灵机 中 对 分 支 的 实现 由 下 图 描述 : 


BRNL ,1 


“指令 1 » 





指令 2 的 机 器 





[318| 
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测试 完 该 值 ， 寄 存 器 被 清空 ， 然 后 定义 了 适当 操作 的 图 灵机 即 开始 执行 。 


例 9.6.1 有 着 一 个 输入 变量 和 两 个 局 部 变量 的 TM 程序 定义 如 下 ， 它 计算 函数 J(n) =2n «1, 88 


和 人 变量 是 wm 且 计 算 中 需要 用 到 的 局 部 变量 是 v, A vo 


INIT v, 
INIT v, 
HOME 3 
LOAD v, ,1 
STOR v;,1 
L1 LOAD v,,1 
BRN L2,1 
LOAD v,,1 
INC 
STOR v, ,1 
LOAD v,,1 
DEC 
STOR y, ,1 
GOTO L1 
L2 LOAD v,,1 
INC 
STOR v, ,1 
RETURN v, 
变量 v, 被 用 来 作为 一 个 计数 器 ， 它 在 从 标志 L1 到 GOTO 语句 的 每 一 次 循环 中 递减 1。 在 每 一 次 


循环 中 ，v, 的 值 递增 。 循 环 会 持续 n 次， 其 中 即 是 输入 。 循环 一 结束 ， 值 又 增加 一 次 ， pn 
的 结果 则 是 2v, +1。 


构造 TM 汇编 语言 的 目的 是 用 来 说 明 图 灵机 的 指令 ， 和 传统 的 机 器 一 样 ， RIAL 


级 语言 中 的 命令 。 利 用 编程 语言 中 的 定义 和 编译 方法 ， 高 级 语言 的 命令 能 够 由 一 系列 汇编 语言 的 指令 


来 定义 。 这 将 会 让 图 灵机 的 计算 与 我 们 熟悉 的 算法 系统 更 加 相似 。 
9.7 练习 


1. 


车 输入 字母 表 为 {a,b} ， 请 构造 图 灵机 来 计算 一 些 特定 的 函数 。 符 号 上 和， 代表 了 任意 的 fa,p| W 
字符 串 。 
a) f(u) = aaa 
_ fa 如 果 z 的 长 度 是 偶数 

SVO -l, aea 
c) f(u) =u" 

qu MRuttvk 
E A 


- E M- (Q, 2 ,T,8, qog) 2-TEBH BIA L 的 部 分 特征 函数 的 图 灵机 。 那 么 ， 请 使 用 图 灵机 


M 来 构造 一 个 能 够 接收 语言 L 的 图 灵机 。 


- &M-(Q, ,了 ,6,gqo,F) 是 一 个 接收 语言 L 的 标准 图 灵机 。 nan 


图 灵机 M'。 一定 要 注意 ， 当 M“ 计 算 立 完成 后 ， 图 灵机 M' 带 上 面 的 数据 应 该 有 这 样 的 形式 : q,BO 
或 者 q,B1B, 


4. 设 工 是 字母 表 上 的 语言 , 设 
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1 #weL 
x0) = 和 0 其他 情况 
是 语言 的 特征 函数 。 
a) "Ry, 是 图 灵 可 计算 的 ,证 明 工 是 递归 的 。 
b) 如 果 工 是 递归 的 ,证 明 存 在 一 个 图 灵机 能 够 计算 x 。 
5. 构造 能 够 计算 下 列 数论 函数 以 及 关系 的 图 灵机 。 不 要 使 用 宏图 灵机 。 
a) f(n) 2n «3 
b) half(n) | /2] EPL x |J x /| va EHTR AE BS RAKE 


c) f(n,,n,,n,) =n, +n, +n, 


d) even(n) «D aun 

y a 

) sme 如 果 n>m 

“to 其 他 情况 | 


6. 构造 一 个 图 灵机 ， 它 能 够 执行 由 下 列 宏 定 义 的 操作 ， 而 且 计算 的 过 程 中 不 能 离开 输入 格局 中 的 带 
片断 。 
a) ZR; 输入 为 BBB， 输 出 为 80B 
b) FL; 输入 为 BnB' B， 输 出 为 BnB'B 
c) E,; 输入 为 BnB mB, 输出 为 BB"*"*B 
d) T; 输入 为 BB nB, 输出 为 BnB'B 
e) BRN; 输入 为 BnB， 输出 为 BnB 
f) INT; 输入 为 BnB mB， 输 出 为 BmBnB 
7. 使 用 9.2 节 到 9.4 节 中 的 宏图 灵机 以 及 已 经 构造 的 图 灵机 来 设计 能 够 计算 下 面 函 数 的 图 灵机 : 
a) f(n) =2n+3 
b) f(n) =n’ «2n «42 
c) f(n,,n,,n,) =n, +n, +n, 
d) f(n,m) =m 
e) f(n,,n,,n,) =n, +2n, 
8. 设计 能 够 计算 下 列 关系 的 图 灵机 。 你 可 以 使 用 9.2 节 到 9.4 节 中 的 宏图 灵机 以 及 已 经 构造 的 图 灵 
机 ， 还 能 够 使 用 练习 5 中 的 图 灵机 : 
1 Zin»m 
a) ain m) ={0 其 他 
| 若是 完全 平方 数 
0 其 他 
1 #n>0, m>0 H m 能够 整除 nn 
0 其 他 
9. 如 果 是 如 下 的 输入 参数 ， 请 写 出 图 灵机 MULT 的 动作 序列 : 
a) n=0, m=4 
b) nzl, m=0 
c) nz2,ms2 


10. 描述 下 面 每 一 个 合成 函数 的 映射 : 


b) persq(n) =f 


c) divides(n,m) = { 





1 


- 


* T3. 


14. 


15. 


20. 


PA 
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a) addo (multo (id, id), addo (id, id)) 
b) pi^» (sapi, eop) 
c) multo (cy, addo (p® , Sop?? )) 


d) multe (multe (pi , E» pi) 


. 给 出 满足 下 面 的 条 件 的 一 元 数论 全 函数 : 


a) g DÆ id, hFE id, 但 是 goh = id, 
b) 8 不 是 一 个 常数 函数 ，h 也 不 是 一 个 常数 函数 ， 但 是 goh 却 是 一 个 常数 函数 。 


- 给 出 满足 下 面条 件 的 一 元 数论 函数 : 


a) 8 不 是 一 对 一 的 函数 ，h 不 是 一 个 全 函数 ,但 是 hog 是 一 个 全 函数 ; 
b) g 关 e, he, hog ze, 其 中 e BARA, 
c) gzid, hid，hog =id, 其 中 id 是 恒 等 函 数 。 
d) g 不 是 全 函数 ,hh 不 是 一 对 一 的 函数 ,但 是 hog = id, 
设 F 是 一 个 能 够 计算 一 元 数论 函数 f 的 图 灵机 。 设 计 一 个 能 够 返回 第 一 个 自然 数 的 图 灵机 ， 例 如 
fn) =0。 如 果 不 存在 这 样 的 n 则 计算 将 会 不 确定 地 继续 。 如 果 F 所 计算 的 函数 不 是 全 函数 ， 那 么 
会 发 生 什么 样 的 情况 ? 
设 F 是 一 个 能 够 计算 一 元 数论 函数 f 的 图 灵机 。 设 计 一 个 能 够 计算 如 下 函数 

a(n) = » fli) 
的 图 灵机 。 
WF G 是 分 别 能 够 计算 一 元 数论 函数 和 8 的 图 灵机 。 设 计 一 个 能 够 计算 下 面 的 函数 

, ha) = Y, eai) e) 

的 图 灵机 。 也 就 是 说 ，h(n) 是 在 范围 0 到 之 间 的 函数 和 g 的 具有 同样 值 的 次 数 。 


- 在 N 上 的 一 元 关系 R 是 图 灵 可 计算 的 ， 如 果 其 特征 函数 是 可 计算 的 。 证 明 N 上 的 任意 可 计算 一 元 


关系 都 能 够 定义 一 个 递归 语言 。 提 示 : 由 计算 其 特征 函数 的 图 灵机 构造 出 接收 R 的 图 灵机 。 


- 设 RC111 是 一 个 递归 语言 ,证 明 R 定义 了 一 个 N 上 的 可 计算 的 一 元 关系 。 
. EHEN 上 的 所 有 一 元 关系 中 ， 存 在 不 是 图 灵 可 计算 的 一 元 关系 。 
. 设 F 是 一 个 包含 了 所 有 的 一 元 数论 全 函数 的 集合 ， 这 些 函 数 满足 f(i) =i, Hi 是 任意 一 个 为 偶数 


的 自然 数 。 证 明 F 中 存在 不 是 图 灵 可 计算 的 函数 。 

BEY. v. vy. v, 是 一 个 TM 程序 中 所 需要 用 到 的 变量 ， 设 寄存 器 1 保存 了 二 个 值 ， 请 写 出 在 执行 
指令 STOR v,, 1 时 的 动作 。 可 以 参看 例 9. 3.2 中 介绍 的 方法 来 写 出 这 些 动作 。 

写 出 一 个 计算 函数 Lv v.) =v, >v, 的 TM 程序 。 


参考 文献 注释 


图 灵机 汇编 语言 提供 了 一 个 体系 结构 ， 这 个 体系 结构 与 另外 一 系列 的 抽象 机 器 一 “随机 访问 机 


器 一 很 相似 [Cook 和 Reckhow, 1973] 。 随 机 访问 机 器 包含 了 无 穷 个 内 存单 元 位 置 以 及 有 限 个 数 的 
寄存 器 ， 每 一 个 寄存 器 都 能 够 存储 一 个 整数 。 而 随机 访问 机 器 的 指令 则 能 够 操作 寄存 器 和 内 存 并 且 还 
能 够 执行 代数 操作 。 这 些 机 器 是 标准 冯 诺 伊 曼 计算 机 体系 结构 的 抽象 。 在 Aho, Hopcroft 和 Ullman 
[1974] 中 能 够 找到 随机 访问 机 器 及 其 等 价 的 图 灵机 的 详细 介绍 。 


第 10 章 ” 乔 姆 斯 基层 次 


在 第 3 章 中 ， 我 们 将 正则 文法 以 及 上 下 文 无 关 文法 介绍 成 基于 规则 的 系统 ， 主 要 用 来 生成 某 种 语 
言 的 字符 串 。 每 条 规则 定义 了 一 个 字符 串 的 转换 ， 任 意 语 言 的 一 条 语句 都 是 使 用 一 系列 允许 的 字符 串 
转换 得 到 的 。 正 则 文法 以 及 上 下 文 无 关 文法 实际 上 是 某 个 更 为 泛 化 的 短语 结构 文法 的 子 集 。 短 语 结构 
文法 被 诺 姆 . 乔 姆 斯 基 作 为 自然 语言 的 语法 模型 而 提出 。 在 本 章 中 ,我们 将 会 探讨 另外 的 两 类 短语 结 
构 文法 一 一 无 限制 文法 和 上 下 文 有 关 文 法 。 这 四 种 文法 一 一 正则 文法 、 上 下 文 无 关 文 法 、 上 下 文 有 关 
文法 以 及 无 限制 文法 ， 组 成 了 乔 姆 斯 基 关 于 短语 结构 文法 的 层次 ， 而 层次 中 的 每 一 种 后 继 的 类 则 会 在 
定义 一 个 规则 的 时 候 允 许 额外 的 灵活 性 。 

自动 机 被 设计 成 为 机 械 地 识别 正则 语言 以 及 上 下 文 无 关 语言 ;确定 型 有 限 自动 机 则 接收 由 正则 文 
法 产生 的 语言 ， 而 下 推 自动 机 接收 上 下 文 无 关 文法 产生 的 语言 。 文 法 的 产生 与 机 械 的 接收 之 间 的 关系 
被 扩展 成 了 新 类 型 的 文法 。 图 灵机 就 被 证 明 能 够 接收 由 无 限制 文法 所 产生 的 语言 。 通 过 限制 图 灵机 的 
内 存 大 小 所 获得 的 一 类 机 器 则 能 够 接收 由 上 下 文 有 关 文 法 所 产生 的 语言 。 


10.1 无 限制 文法 


短语 结构 文法 被 设计 成 提供 自然 语言 语法 的 形式 化 模型 。 其 名 字 (短语 结构 ) 基于 如 下 命题 : 属于 
某 一 语言 的 句子 有 可 能 存在 几 种 不 同 的 语法 模式 。 句 子 本 身 是 由 短语 组 成 的 名 词 短语 、 动 词 短 语 以 及 
类 似 的 短语 ， 它 们 都 是 按照 某 一 个 句子 模式 来 专门 安排 的 。 语 法 的 规则 定义 了 句子 以 及 短语 的 结构 。 

短语 结构 文法 的 成 分 和 第 3 章 中 介绍 的 正则 文法 和 上 下 文 无 关 文 法 的 成 分 是 一 样 的 。 短 语 结构 文 
法 包含 了 一 个 变量 的 有 限 集合 V、 一 个 字母 表 、 一 个 初始 变量 以 及 一 套 规则 集 。 这 些 规则 的 形式 均 
A uv, 其 中 4 和 vv 包含 了 变量 以 及 终止 符号 ， 并且 定 义 了 所 能 允许 的 字符 串 转 换 。 对 字符 串 z 应 用 
某 一 条 规则 是 两 步 的 过 程 ， 包 括 : 

i) z 的 某 一 个 子 串 符合 规则 的 左 半 部 分 ， 然 后 

i) 用 规则 的 右 半 部 分 替换 左 半 部 分 。 i 

对 字符 串 xuy 应 用 规则 uv, SH xuyoxvy, ZET FER xwy。 如 果 存 在 一 系列 的 规则 能 够 
将 p 转换 成 g， 则 说 明 字 符 串 q 能 够 由 p 推导 出 ， 即 p Sq. GHR, WEL (G), ， 是 能 够 被 开始 符 
号 8 推导 出 的 ， 使 用 终止 符号 组 成 的 字符 串 的 集合 。 用 符号 来 表示 就 是 L (G) 2IweX'|sSwl, 

一 个 类 型 的 语法 都 是 由 对 规则 集 的 形式 进行 某 种 约束 来 定义 的 。 而 上 下 文 无 关 文 法 也 是 短语 结构 
文法 ， 只 不 过 上 下 文 无 关 文 法 的 每 一 条 规则 的 左 半 部 是 一 个 单独 的 变量 ， 而 右 半 边 则 能 够 是 变量 和 终 
结 符号 的 任意 组 合 。 正 则 文法 的 每 一 条 规则 都 必须 有 如 下 的 形式 : 

i) AaB, 

ii) Aa, 或 者 

iii) A>), 

其 中 A, BeV, Maced. 

无 限制 文法 是 短语 结构 文法 中 最 大 的 一 类 ， 对 于 无 限制 文法 的 规则 ,没有 任何 的 限制 ， 只 是 要 求 
规则 的 左边 不 能 为 空 而 已 。 

定义 10.1.1 无 限制 文法 是 一 个 四 元 组 (V, 卫 ,P;S)， 其 中 V 是 变量 的 一 个 有 限 集合 ; X (FH 
A) 是 终止 符号 的 有 限 集 合 ; P 是 规则 的 集合 ; m SEV 集合 中 的 一 个 特殊 的 元 素 。 无 限制 交 法 的 产 
生 式 有 下 面 的 形式 : uv, HPue(VUL)*,ve(VUL)*, HREV FLAW. 

下 面 有 两 个 例子 来 描述 无 限制 文法 的 生成 能 力 。 例 10. 1.1 描述 了 语言 1a'b'c'|i=01， 我 们 知道 
该 语言 是 不 可 以 从 上 下 文 无 关 文 法 推导 来 的 ， 但 是 却 能 够 由 无 限制 文法 通过 六 条 规则 来 生成 。 第 二 个 
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例子 描述 了 无 限制 文法 是 怎样 用 来 生成 字符 串 的 拷贝 的 。 
例 10.1.1 无 限制 文法 
Vzl$S,A,C| S—aAbc | X 
Y -da,b,c| A—aABC [ X 
Cb—bC 
Cc—cc 
能 够 生成 语言 1a'b'c | i0| ， 其 中 开始 符号 是 5。 字 符 串 aibic'， 其 中 i>0， 是 能 够 由 开始 符号 8 推导 
的 ， 具体 过 程 如 下 : 


S —aAbc 
ist j 
=a'A(bC)'"'be 
—a'(bC)' bc 


使 用 规则 A—aABC 能 够 生成 最 开始 的 i 个 a。 而 规则 Cobe 则 允许 最 后 的 一 个 C 能 够 和 4 进行 位 置 
的 交换 ， 从 而 越过 一 个 个 的 5 从 而 到 达 b 和 c 的 分 界 处 ， 当 到 达 最 左边 的 c 的 时 候 ， 符 号 C 能 够 用 c 
来 替换 。 这 个 过 程 一 直 持续 到 每 一 个 C 都 往 右 移动 越过 所 有 的 b， 并 且 最 终 被 转换 成 c。 L1 
例 10.1.2 无 限制 文法 ， 其 终止 符号 字母 表 为 la, bp,[ ,]} ， 由 下 列 产生 式 组 成 : 
S—aT[a] | bT[b}| [] 
T[ —aT( A | PT[ B| [ 
Aa—aA 
Ab—bA 
Ba—aB 
Bb—bB 
A]-a] 
B]—5]| 
产生 语言 fu [u]| ue la, b)*]. 
变量 了 左边 多 出 的 a 或 者 b 则 会 在 使 用 产生 式 后 ,在 7 [右边 生成 变量 4 或 者 B。 使 用 这 些 规则 
交换 了 一 个 变量 和 一 个 终结 符 的 位 置 ， 而 推导 的 过 程 则 是 通过 传递 在 括号 中 的 字符 串 的 拷贝 进行 的 。 
当 变 量 与 符号 ] 相 邻 的 时 候 ， 恰 当 的 终结 符 就 被 加 到 第 二 个 字符 串 中 去 了 。 整 个 过 程 重复 着 来 生成 其 
他 的 终结 符 ， 或 者 通过 应 用 规则 T [一 { 来 终止 。 而 推导 过 程 
S 2aT[a] 
=aaT| Aa] 
-»aaT| aA | 
一 aaT[ aa] 
=aabT| Baa | 
=aabT{ aBa] 
=aabT| aaB | 
=aabT| aab | 
=aab{ aab | 


则 展示 了 在 推导 过 程 中 变量 所 扮演 的 角色 。 口 
在 上 述 两 个 例子 的 文法 中 ， 每 一 条 规则 的 左 半边 包含 了 一 个 变量 ， 这 并 不 是 无 限制 文法 所 要 求 
的 。 然 而 ， 如 果 假 设 必须 要 在 规则 的 左 半边 包含 一 个 变量 的 话 ， 也 并 不 会 缩小 要 产生 的 语言 的 集合 
(55513), : 
在 对 整个 形式 语言 的 研究 中 ， 对 于 一 个 语言 来 说 ;我 们 描述 了 通过 文法 产生 以 及 使 用 一 个 有 限 状 
态 机 来 接收 它们 之 间 的 对 应 。 正 规 语言 使 用 一 个 有 限 状 态 自动 机 来 接收 ; 而 上 下 文 无 关 语 言 则 使 用 下 
推 自动 机 来 接收 。 无 限制 文法 提供 了 字符 串 转换 的 最 灵活 的 典型 ， 对 于 需要 匹配 的 子 串 及 其 的 替换 字 
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符 串 ， 没 有 做 出 任何 的 限制 。 那 么 ， 无 限制 文法 所 能 产生 的 语言 需要 一 个 最 有 能 力 的 抽象 机 器 来 接 
收 ， 这 一 点 看 上 去 是 十 分 合理 的 ， 而 事实 也 恰 是 如 此 。 下 面 的 两 个 定理 说 明了 一 个 语言 可 由 无 限制 文 
法 产生 当 且 仅 当 其 能 够 被 一 个 图 灵机 所 接收 。 

定理 10.1.2 设 G=(V,2,P,S$) 是 一 个 无 限制 文法 ， 则 语言 下 (G) 是 一 个 递归 可 政 举 语言 。 

证 明 : 我 们 简要 描述 一 下 设计 一 个 三 带 非 确定 型 图 灵机 M 来 接收 语言 LCG) 。 我 们 设计 图 灵机 
M, 它 计算 模拟 了 文法 G 的 推导 过 程 。 第 一 带 上 面 保存 了 输入 字符 串 p， 其 中 pe L’, Bw EEN 
保存 了 G 中 的 规则 的 代表 形式 ， 其 中 每 一 条 规则 uv 使 用 uty 来 表示 ,其 中 # 是 为 了 分 隔 u,v 而 专 
门 保 存 的 带 符号 。 规 则 之 间 用 两 个 连续 的 # 符 号 来 分 隔 。 而 对 于 文法 'G 的 模拟 则 在 第 三 带 上 进行 。 

接收 语言 L(G) 的 图 灵机 M 的 计算 包括 下 面 的 动作 : 

1. 开始 符号 5 被 写 在 第 三 带 第 一 个 位 置 上 ; 

2. 文法 G 的 规则 写 在 第 二 带 上 ; 

3. 从 第 二 代 上 面 选取 一 个 规则 utv; 

4. 如 果 存 在 的 话 ， 就 在 第 三 带 上 面 选择 字符 串 u 的 一 个 实例 ， 否 则 ， 即 不 存在 这 样 的 w， 则 计算 
终止 ， 且 处 于 拒绝 状态 ; 

5. 在 第 三 带 上 用 v 来 替代 u; 

6. 如 果 第 三 带 上 面 的 字符 串 和 第 一 带 上 的 匹配 ， 那 么 计算 终止 ， 且 处 于 接收 状态 ; 

7. 计算 从 第 三 步 开始 继续 ， 模 拟 其 他 规则 的 应 用 。 
由 于 wu 和 v 的 长 度 有 可 能 不 同 ， 则 应 用 规则 xuy 一 xvy 则 可 能 需要 将 字符 串 y 向 左 或 者 向 右 平移 。 

对 于 任意 的 字符 串 peL(G)， 需要 应 用 一 系列 的 规则 来 推导 出 p。 这 种 推导 需要 图 灵机 M 的 某 
次 非 确定 型 的 计算 来 检查 ， 且 M 将 会 接收 p。 相 反 地 ， 图 灵机 在 第 三 带 上 的 动作 从 开始 符号 5S 开 
始 ， 精 确 地 产生 了 字符 串 。 图 灵机 M 所 能 够 接收 的 是 语言 L(G) 中 的 终结 符号 组 成 的 字符 串 。 因 


m, L(M) =L(G)。 E 
$i) 10.1.3 语言 L= {a'b'c'| iSO} 由 下 面 规则 产生 
S—aAbc | 入 
A—aAbC | 入 
Cb—bC 


Cc—cc 
接收 语言 L 的 图 灵机 的 计算 模拟 了 文法 的 推导 。 在 第 二 带 上 的 文法 规则 的 表示 是 : 
BStaAbCIESIHHLASIGAD CIHLATHHECDDCHBECCHCCB 
规则 SA 用 字符 串 SHH ZEA. 56 — ASAE SRE HEE SEORUM 05 Ae ad RUE 2E 21 OP Ba FT OK, piod 
边 ， 这 个 例子 中 是 空 字符 串 ， 后 面 紧 跟着 字符 串 禁 。 

定理 10.1.3 设 工 是 一 个 递归 可 枚 举 语言 ， 则 存在 一 个 无 限制 文法 G, 且 L(G) =L, 

证 明 : 由 于 工 是 一 个 递归 可 枚 举 语言 ， 则 它 能 够 使 用 一 个 确定 型 图 灵机 M = (Q, ,TT,6 ,qo,F) 来 
接收 。 那 么 使 用 一 个 无 限制 文法 G =(V, 荆 ,P,$) 可 以 模拟 图 灵机 M 的 运算 。 将 图 灵机 的 配置 参数 用 
字符 串 来 表示 ， 则 图 灵机 的 一 个 状态 转移 6( q;,x) = [9g),y,R] ， 配 置 参数 为 ug,xvB， 能 够 使 用 字符 串 
形式 uq;xvB—uyq;vB 来 表示 。 

在 文法 G 中 , 一 个 终结 符 字符 串 的 推导 包括 了 三 个 不 同 的 子 推导 : 

i) ERFAR u [qoBu] ,其 中 ue X^; 

ii) 模拟 图 灵机 M 在 字符 串 [qoBu] 之 上 的 运算 , H 

ii) 如 果 图 灵机 .M 接收 &， 则 移 除 模拟 的 子 字 符 串 。 

对 于 任意 一 个 终结 符 w cD, 文法 G 均 包含 一 个 变量 4,。 这 些 变量 与 S、T、[、 和 ] 一 起 用 来 
生成 字符 串 u_[ qoBu] 。 对 于 某 个 运算 的 模拟 则 使 用 与 M 当前 状态 相对 应 的 变量 。 变量 .Ex 和 五 :用 在 
推导 的 第 三 步 中 。 文 法 的 终结 符 是 图 灵机 M 的 输入 字母 表 的 一 个 元 素 ， 因 而 文法 G 的 字母 表 是 : 

by = la, ,25,:77,4,] 
= EB ls A IU 
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HES PRO TS ABP A LI A HEE EFPIA TAE u[q,Bu], Hp u EE 中 的 任意 一 个 
字符 串 ， E 10. 1.2 中 有 所 介绍 。 

1.S—a,T [a4]| [4B] 1<i<n 

23 iis TOU oB 1<i<n 

3.Aig—ajA, lxi, j&n 

4.A4, —5aj]] 1<i<n 

当 输入 字符 串 是 二 时 ， 图 灵机 的 计算 是 在 字符 串 [quBu] 上 模拟 的 ， 并 且 通 过 重 写 图 灵机 M 的 
状态 转换 来 得 到 新 规则 ， 这 些 规则 主要 是 用 来 说 明 字 符 串 的 转换 。 


5. qxyzq;y 4 (qx) -[q,z,R] B yeT 
6. qx] —zqB] 4 6(q,,x) =[g,,z,R] 
7. yqix4,yz 256(q,,x) 2 [a z,L] B yer 


如 果 图 灵机 M 的 运算 在 接收 状态 停机 ， 则 推导 中 擦 除了 括号 内 的 字符 串 。 变 量 E, 擦 除了 停机 位 
置 带 头 右边 的 字符 串 。 当 到 达 了 终端 的 标记 符号 ] 时 ， 就 产生 了 E, 这 个 变量 。 


8. qux—E, 当 5(9;，z) 未 被 定义 且 q; eF 

9. E.x—E, xe. 

10. E,] >E, 

11. xE, E, xer 

12. [Ej 
推导 从 生成 字符 串 x[ qoBu] 开 始终 止 于 产生 了 字符 串 w， 且 ueL(M)。 如 果 ugL(M)， 则 嵌 套 在 推 

导 过 程 中 的 括号 永远 也 不 会 被 删除 ， 且 推导 的 过 程 不 能 够 产生 一 个 终结 符 字符 串 。 a 

$i) 10. 1. 4 构造 一 个 能 产生 被 下 图 所 示 的 图 灵机 接收 的 语言 的 文法 。 该 ala R 
图 灵机 接收 语言 a” b(aUb)" 。 当 过 到 第 一 个 b 时 ,图 灵机 M 停机 ， 且 此 时 B/B R 
的 状态 是 gq。 

文法 G 的 变量 和 终结 符 是 [n M 

= [a,b] 


V = IST EE Pa ,A,X| U 14.4 | o 
规则 分 为 三 部 分 给 出 。 





模拟 规则 : 输入 生成 规则 : 
转换 规则 S—aT[a] | bT[b] | [qB] 
6(qo,B) 2 [q,B,R] qo Ba—Bq,a | Tl —aT( A | bT[X| [goB 
qoBb—»Bqib Pe 
n nag Ab—bA 
q9B]—8Bq, B] A]—a] 
8(q,,a) =[q,,4,R] q;aaaq,a Xa3yaX 
a eei Xb—bX 
qı Pie X]5] 
214J 一 491 
8(q,,B) =[q,,B,R] qı Ba—Bq,a EM 
qı Bb—Bq,b Ma: 
q, BB —Bq,B E,a—E, aE,—E, 
4, B]—8q,B] E,b—E, bE,—E, 
E,B—E, BE,E, 
E, JSE; [E,—X 


在 图 灵机 M 中 ,输入 字符 串 为 ab， 则 被 M 接收 ， 在 文法 G 中 有 相同 的 推导 用 于 接收 文法 G， 其 推导 


RIF FARAR 191 


过 程 如 下 : 
qoBabB S=aT| a] 
I-Bq,abB —abT| Xa] 
I-Baq,bB 一 ap[ q,BXa] 
一 ap[qoBaX] 
一 ab[ qyBab] 
一 ap[ Bq,ab] 
—ab[ Baq,b] 
=ab{ BaE, | 
—ab[ BaE, 
=ab{ BE, 
=ab[E, 
—ab. 
无 限制 文法 的 属性 能 够 用 于 建立 递归 可 枚 举 语 言 的 封闭 结果 。 这 个 证 明 与 定理 7.5.1 MTS 
无 关 文 法 的 证 明 类 似 ， 并 留 作 练 习题 。 
定理 10.1.4 递归 可 枚 举 语言 的 集合 在 并 运算 、 连 接 运算 以 及 克 林 星 闭 包 运算 上 是 封闭 的 。 


10.2 上 下 文 有 关 文 法 


上 下 文 有 关 文 法 代表 了 上 下 文 无 关 文法 和 无 限制 文法 的 中 间 状 态 。 它 对 于 产生 式 的 左 半 部 没有 任 
何 限制 ， 但 是 右 半 部 的 长 度 要 求 最 起 码 和 左 半 部 一 样 长 〈 即 要 长 于 左 半 部 分 或 者 和 左 半 部 分 一 样 长 ) 。 

定义 10.2.1 短语 结构 文法 G=(V, 耻 ,P,S) 被 称 为 上 下 文 有 关 文 法 ，(Ccontext- sensitive) 当 文 法 
G 中 的 每 一 条 形 如 uv HAMM, HP ue(VUL)*,ve(VUL)*, 都 有 length (u) «length (v). 

满足 定义 10. 2. 1 中 的 规则 被 称 为 单调 的 (monotonic) 。 每 一 次 对 单调 规则 的 应 用 ， 都 会 使 得 推导 
后 的 字符 串 的 长 度 或 者 相等 ， 或 者 增加 。 上 下 文 有 关 文 法 产生 的 语言 ， 被 称 为 上 下 文 有 关 语 言 。 

上 下 文 有 关 文 法 最 初 如 同 短语 结构 文法 一 样 来 定义 ， 该 文法 中 的 每 一 条 规则 都 形 如 uAv—uwv , A 


eV,we(VUX)'Hu,ve(VUX)'. LEIBBgUU A B] T Ait A 能 够 用 w RAR, SAMS. 


于 前 面 有 一 个 ,后 面 有 一 个 v 的 上 下 文 之 中 。 很 明显 ， 每 一 条 这 样 定义 的 规则 都 是 单调 的 。 从 男 
一 方面 来 说 ， 由 一 条 单调 规则 定义 的 状态 转换 能 够 使 用 一 组 形 如 uAv—uwv 的 规则 来 生成 (练习 10 
和 练习 11)。 
规则 的 单调 属性 保证 了 空 字符 串 不 是 上 下 文 有 关 语 言 的 元 素 。 将 例 10. 1. 1 中 的 规则 S 去 掉 ， 
则 得 到 了 无 限制 文法 
S—4aAbc 
A—aAbC | X 
Cb—bC 
Cc—cc 
该 文法 能 够 产生 语言 |a'ibic' | i>0} 。 由 于 入 规则 违反 了 了 上下文 有 关 文 法 的 单调 性 ， 所 以 则 将 S 规则 和 
A 规则 用 下 面 的 规则 来 替换 
S—aAbc | abc 
A—aADC | abC 
这 样 就 产生 了 一 个 等 价 的 上 下 文 有 关 文法 。 
和 定理 10.1. 2 中 图 灵机 类 似 ， 设 计 一 个 非 确定 型 图 灵机 来 接收 上 下 文 有 关 语 言 。 规 则 中 确立 的 
输入 字符 串 只 能 增长 的 特性 ， 可 以 允许 使 用 输入 字符 串 的 长 度 来 终止 不 成 功 推导 的 模拟 过 程 。 当 推导 
出 的 字符 串 的 长 度 比 输入 字符 串 的 长 度 长 的 时 候 ， 计 算 终止 ， 并且 拒 绝 该 输入 字符 串 。 
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定理 10.2.2 每 一 个 上 下 文 有 关 语 言 都 是 递归 的 。 
WERA: 使 用 定理 10. 1. 2 中 提出 的 方法 , 在 一 个 三 带 非 确 定型 图 灵机 M 上 模拟 上 下 文 有 关 文法 的 


推导 。 整 个 推导 过 程 ， 包 括 最 后 的 结果 ， 都 保存 在 第 三 带 上 。 当 规则 uv 应 用 在 第 三 带 上 的 字符 串 





xuy 的 时 候 ， 字 符 串 xvy 被 写 在 带 上 ， 并 紧 跟 在 字符 串 xuy# 之 后 。 符号 # 被 用 来 分 隔 推导 的 字符 串 。 
当 输 入 字符 串 为 p 时 ， 图 灵机 M 的 计算 将 会 执行 下 述 的 一 系列 的 操作 : 

S# 被 写 在 第 三 带 的 第 一 个 位 置 上 。 

文法 G 的 规则 写 在 第 二 带 上 。 

从 第 二 带 上 选择 规则 utv 

Wt 4q# 是 第 三 带 上 最 近 写 的 字符 串 ， 则 ; 

a) 如 果 存 在 的 话 ， 则 在 q 中 选择 字符 串 u 的 一 个 实例 。 在 这 个 情况 之 下 ，g 能 被 写成 zuy。 

b) 否则， 计算 则 会 终止 在 一 个 不 接收 的 状态 。 

. XVy# 被 写 在 第 三 带 上 ， 并 紧 跟 在 gq# 之 后 。 

a) 若 xvy =p， 则 计算 终止 在 接收 状态 ; 

b) WR zy 出 现在 第 三 带 的 其 他 位 置 上 ， 则 计算 终止 在 非 接收 状态 。 

c) 如 果 length(xvy) > length(p) ， 则 计算 停止 在 非 接收 状态 。 

. 计算 从 第 三 步 开 始 继续 ， 从 而 模拟 下 一 条 规则 的 应 用 。 

E (VU E) 中 只 存在 有 限 个 字符 串 的 长 度 比 length (p) 短 或 相等 。 这 表明 了 每 一 个 推导 过 程 最 
终 都 会 终止 ， 比 如 说 进入 一 个 循环 ， 或 者 推导 一 个 字符 串 且 该 字符 串 的 长 度 大 于 length(üp) 。 当 选择 
的 规则 不 能 够 应 用 在 当前 的 字符 串 上 时 ， 有 的 计算 会 在 第 四 步 终 止 。 循 环 推导 = Hu Sw >w, WA 
在 第 6(b) 步 终止 。 长 度 的 限定 用 来 在 第 6(c) 步 终止 所 有 不 成 功 的 推导 。 

语言 L(G) 中 的 每 一 个 字符 串 都 由 一 个 非 循环 的 推导 来 生成 。 这 样 推导 的 模拟 则 会 导致 图 灵机 M. 
接收 该 字符 串 。 由 于 图 灵机 M 的 每 一 次 运算 都 会 终止 ， 因 此 说 明了 L(G) 是 递归 的 (4548.22), MI 


10.3 线性 有 界 自动 机 


我 们 已 经 考察 了 几 种 对 标准 图 灵机 的 修改 并 不 会 改变 图 灵机 所 接收 的 语言 的 集合 。 对 带 容量 的 限 
制 降低 了 图 灵机 计算 的 能 力 。 线 性 有 界 自动 机 是 一 个 图 灵机 ， 但 是 其 带 的 容量 则 决定 于 输入 字符 串 的 
长 度 。 输 入 字母 表 包含 两 个 符号 ，< 和 > ,来 表明 带 的 左边 界 和 右边 界 。 

定义 10.3.1 线性 有 界 自动 机 (linear- bounded automaton, LBA) #—/4*M=(Q,>,T,6,q, 
GE), PQ. LT. ô q, 和 下 与 非 确定 型 图 灵机 中 人 定义 的 一 样 。 符 号 《和 》 是 于 中 特殊 的 
IL® o 

LBA 的 计算 的 初始 格局 是 qo (w) ,需要 length(w) +2 个 带 位 置 。 虽 然 终端 标记 符号 (A) BGE 
带 上 ， 但 并 不 作为 输入 字符 串 的 一 部 分 。 计 算 将 会 在 由 《和 》 所 标记 的 边界 之 内 进行 。 终 端 标记 符号 
能 够 被 机 器 读 取 ， 但 是 并 不 能 够 被 擦 除 。 在 读 取 〈 后 的 状态 转换 必须 有 向 右 的 移动 ， 而 读 取 、 后 的 状 
态 转换 则 必须 有 向 左 的 移动 。 如 果 输 入 字符 串 为 《w》， 且 最 终 图 灵机 停止 在 接收 状态 时 ， 字 符 串 we 
( -1{《,)|) 最终 能 够 被 LBA 接收 。 

我 们 下 面 展示 每 一 个 上 下 文 有 关 语 言 都 能 够 被 一 个 线性 有 界 自 动机 接收 。 构 造 一 个 LBA 来 模拟 
上 下 文 有 关 文 法 的 推导 。 图 灵机 能 够 构造 来 模拟 无 限制 文法 的 推导 ， 且 最 开始 就 是 将 推导 的 规则 写 在 
其 中 一 条 带 上 。 而 LBA 的 关于 带 容量 的 限制 则 禁止 了 这 种 方法 。 然 而 ，LBA 的 状态 和 状态 转换 则 用 
来 对 这 些 规则 进行 编码 。 

图 10-1 表明 了 应 用 规则 Sa— aAS 时 怎样 用 状态 转换 来 对 其 进行 模拟 。 规 则 的 应 用 声明 了 一 个 字 
符 串 的 转换 uSav=>uahSv。 这 个 图 中 最 开始 的 两 个 转换 确认 了 带 上 从 带头 所 在 的 位 置 开始 的 字符 串 匹 
ACY Sa。 在 Sa 被 aAS 替换 之 前 ， 且 在 决定 推导 出 的 字符 串 是 否 与 能 够 参与 计算 的 带 片断 相 适 合 时 ， 
FIFE v 是 不 起 任何 作用 的 。 如 果 读 到 了 字符 > ， 则 计算 终止 ， 和 否则 ; FRR v 则 向 右 平 移 二 不 单位 
并 且 用 GAS 来 替换 掉 Sa 
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图 10-1 使 用 LBA 来 模拟 Sa—aAs 335 


定理 10.3.2 设 工 是 一 个 上 下 文 有 关 语言 。 则 存在 一 个 线性 有 界 自 动机 M， 且 LI(M) =L, 
WEBB: FA LA—T LE MAKBA, WHHL PRK G=(V,Y,P,S), ALH=L(G), 
构造 一 个 具有 两 道 带 的 LBA M 来 模拟 文法 G 的 推导 。 第 一 道 包 含 了 输入 字符 串 ， 且 包括 了 终端 字符 
标记 。 第 二 道 则 存储 了 由 模拟 推导 产生 的 字符 串 。 
文法 G 的 每 条 规则 都 在 一 个 子 机 器 M 中 被 编码 。 当 输入 是 《〈《p》 时， 机 器 M 包含 下 面 一 系列 的 
动作 : 
1. S 写 在 第 二 道 的 第 一 个 位 置 。 
2. 带头 移动 到 能 够 扫描 第 二 道上 字符 串 符号 的 位 置 。 
3. 规则 u—>v 被 非 确 定 地 选取 ， 且 运算 试图 应 用 该 条 规则 。 
4. a) 如 果 第 二 道上 从 带头 位 置 开始 的 子 串 和 不 匹配 ， 则 计算 停止 于 拒绝 接收 状态 ; 
b) 如 果 带 头 在 扫描 uw, [BESTE v 替换 wu 之 后 得 到 的 字符 串 的 长 度 大 于 length (p), MAR IE 
在 拒绝 接收 状态 。 
c) AM, u 在 第 二 道上 被 v 替换 。 
5. 如 果 第 二 道 包含 字符 串 p， 则 计算 停止 在 接收 状态 。 
6. 计算 从 第 二 步 开 始 继续 进行 ， 从 而 模拟 应 用 另外 一 条 规则 。 
定义 机 器 M 用 来 接收 语言 L。 语 言 L 中 的 每 一 个 字符 串 都 由 文法 G 的 推导 生成 ， 而 且 推导 的 模 
拟 导 致 M 接收 字符 串 。 因 而 LEL(M)。 相 反 地 ， 当 输入 字符 串 是 (p) 时 ，M 的 运算 终止 于 接收 状态 ， 
且 运 算 的 过 程 中 包含 了 由 第 二 步 和 第 三 步 生成 的 很 多 字符 串 的 转换 。 这 些 转换 定义 了 文法 G rn p 的 推 
导 和 L(M) CL。 E 
为 了 获得 上 下 文 有 关 语言 〈 线 性 有 界 自 动机 接收 语言 集合 的 子 集 ) 的 完整 特性 ， 我 们 可 以 展示 ， 
被 这 样 一 个 自动 机 接收 的 任意 语言 都 是 由 上 下 文 有 关 文法 生成 的 。 文 法 的 规则 能 够 直接 由 自动 机 的 状 
态 转换 来 构造 。 
定理 10.3.3 设 语言 工 是 线性 有 界 自动 机 接收 的 语言 ， 则 工 - | 和 是 上 下 文 有 关 语 言 b 
证 明 : IEM-(Q,X,,DT,0,q4,, C.) ,E) BRIE L 的 线性 有 界 自 动机 。 设 计 一 个 上 王 文 有 关 文 
法 G 来 生成 L(M) 。 利 用 定理 10. 1. 3 中 的 方法 ， 接 收 输入 字符 串 p 的 M 的 运算 由 文法 G 中 对 p KHE 
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导 来 模拟 。 但 是 这 里 不 能 够 使 用 构造 模拟 图 灵机 运算 的 无 限制 文法 的 方法 ， 原 因 是 擦 除 模拟 过 程 的 规 
则 并 不 能 够 满足 上 下 文 有 关 文 法 的 单调 性 的 限制 。 在 上 下 文 有 关 文 法 的 推导 中 ， 不 能 够 擦 除 符号 的 规 
定 限 制 了 推导 出 的 字符 串 的 长 度 。 整 个 模拟 过 程 通过 使 用 复合 对 象 作为 变量 来 完成 。 
文法 G 的 终止 符号 字母 表 由 M 的 输入 字母 表 得 到 ， 但 删除 了 终端 标识 符号 。 有 序 对 被 用 作 变 量 。 
有 序 对 的 第 一 个 元 素 是 一 个 终止 符号 ， 第 二 个 元 素 是 一 个 字符 串 ， 包 含 了 带 符号 以 及 可 能 的 状态 和 终 
端 标识 符 。 
io-Xu-i(G)Ln12,2,-,4,] 
V 2 [S,A,[a,,x] [a €x], anx) ] La, (3) ], L5, 4,x1  L,,4, (x, 
(oo [aax], [a,,4) 1, [2:4 ], La, 4) ], La), (4,3) ] L4, (x44) ]] , 
HH a e X; xeT, Ha, eQ. 
S 和 4 规则 生成 了 有 序 对 ， 且 有 序 对 的 元 素 代 表 了 输入 字符 串 和 M 的 初始 配置 参数 。 
1.8$— [a;, q (a,;] A 
SMCA (a;) ] 
其 中 每 一 个 we Le 
2.A— [an q] A 
— [a,, a;)] 
其 中 每 一 个 we Le 
应 用 5 规则 和 4 规则 推导 生成 了 如 下 形式 的 一 系列 有 序 对 
[a,, qo (a,) ] 
La, ,qo 4; ] La, 1a; | aranan) ] 
通过 连接 有 序 对 的 第 一 个 元 素 得 到 的 字符 串 aaa, RET M 的 一 个 运算 的 输入 字符 串 。 而 第 二 
个 元 素 产 生 了 gq。《ai a…a; ) ， 即 线性 有 界 自动 机 的 初始 格局 。 
模拟 图 灵机 的 计算 的 规则 通过 重 写 M 的 状态 转换 而 得 到 ， 这 些 规则 也 同样 是 转换 ， 用 于 修改 有 
序 对 的 第 二 个 元 素 。 一 定 要 注意 ， 有 序 对 的 第 二 个 元 素 并 不 产生 字符 串 % 《〈》 ， 如 果 输 入 字符 捉 是 空 
字符 串 ， 则 文法 也 不 会 对 其 进行 模拟 。 定 理 10. 1. 3 中 的 技术 能 够 加 以 修改 从 而 产生 所 需 规则 来 模拟 
M 的 运算 ， 其 详细 的 部 分 留 下 作为 练习 。 
一 县 成 功 地 进行 了 运算 ,推导 过 程 则 必须 生成 初始 的 输入 字符 串 。 当 一 个 接收 配置 参数 生成 的 时 
候 ， 有 序 对 第 二 个 元 素 中 带 有 接收 状态 的 变量 被 转换 成 包含 第 一 个 元 素 的 终止 符 串 。 
3. [an d; XX) a 
La q, <x)] a, 
258 (q,, () =Ø H q, EF 
[a,, xq,)] a, 
[a;, (xq) ] a, 
46 (a,)) =ØH aq EF 
[a,, q,x] —a, 
[a qx) ] a; 
[a,, (q,x] a, 
[a , (qix)] >a, 
45 (q, x) =@HqeF 
推导 将 会 在 把 剩 下 的 变量 转换 成 第 一 个 元 素 中 包含 的 终结 符 后 完成 。 
4. [a;,u]a;—a;a; 
a,[ a; ,u ]—4a;a; 


对 于 任意 的 a;e Sy Ala,,u) e V, if 
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10.4 乔 姆 斯 基层 次 


乔 姆 斯 基 列举 出 了 组 成 乔 姆 斯 基层 次 的 这 四 类 文法 〈 以 及 语言 ) 。 无 限制 文法 、 上 下 文 有 关 文 法 、 
上 下 文 无 关 文法 以 及 正则 文法 ,它们 分 别 被 称 为 0 型 文法 、1 型 文法 、2 型 文法 和 3 型 文法 。 随 着 文法 
前 面 数 字 的 增加 ， 规 则 的 限制 会 越 来 越 多 。 乔 姆 斯 基层 次 中 文法 的 嵌 套 导致 了 相对 应 的 语言 的 退 套 。 
每 一 个 包含 空 字符 串 的 上 下 文 无 关 语言 可 以 由 这 样 一 个 上 下 文 无 关 的 文法 生成 ， 该 文法 中 Sd 是 仅 
有 的 包含 入 的 规则 (定理 4.2.3) 。 删 除 这 个 仅 有 的 入 规则 会 得 到 一 个 上 下 文 有 关 文 法 ， 其 产生 的 语言 
是 L - |N| 。 因 而 ， 语 言 工 - { 入 | 是 上 下 文 有 关 的 ， 而 此 时 工 是 上 下 文 无 关 的 。 忽 略 由 空 字符 串 而 给 
上 下 文 有 关 语 言 带 来 的 复杂 性 ， 则 每 一 种 ;型 语言 都 是 ;- 1 型 的 。 

上 面 的 包含 是 正确 的 。 集 合 |a'b'| i=0| 是 上 下 文 无 关 的 但 并 不 是 正则 的 (定理 6.5.1)， 类 似 地 ， 
[abc | i>0} 是 上 下 文 有 关 的 但 是 却 不 是 上 下 文 无 关 的 ( 例 7.4.1)。 在 第 11 章 中 ,停机 问题 的 语言 
被 证 明 是 递归 可 枚 举 的 但 并 不 是 递归 的 。 将 这 些 结果 整合 在 一 起 ， 并 且 应 用 定理 10. 2. 2， 就 会 建立 起 
上 下 文 有 关 语 言 的 集合 是 递归 可 枚 举 语言 的 子 集 这 样 一 个 正确 的 包含 关系 了 。 

在 乔 姆 斯 基层 次 中 ， 每 一 类 语言 都 由 用 某 一 类 语法 生成 的 语言 以 及 相应 的 接收 机 器 的 类 型 来 刻 
画 。 生 成 和 识别 关系 综合 的 描述 参见 下 表 。 








3X. uk BOE 接收 的 机 器 

0 型 文法 ， 短 语 结构 文法 ， 无 限制 文法 递归 可 枚 举 图 灵机 ， 非 确定 型 图 灵机 

1 型 文法 ， 上 下 文 有 关 文 法 ETXAX 右 线性 有 界 自 动机 

2 型 文法 ， 上 下 文 无 关 文 法 EF RE 下 推 自动 机 

3 型 文法 ， 正 则 文法 ， 左 线性 文法 ， 正则 确定 型 有 限 自动 机 ， 不 确定 型 有 限 
右 线性 文法 自动 机 
10.5 练习 
1. 设计 无 限制 文法 来 生成 下 面 的 语言 ; 


a) la'bla'b |i, j=0| 

b) {a‘bic'd' | iz0| 

c) |www] we la,b] ' | 

2. 证 明 每 一 个 由 下 列 文法 

S—aAbc | X 
A—aADBC | X 
Cb—bC 
Cc—cc 


生成 的 终结 符 字符 串 都 有 abc 的 形式 ， 其 中 i>0, 


*3. 证 明 每 一 个 递归 可 枚 举 语言 能 够 由 一 个 文法 生成 ， 在 这 个 文法 中 ， 每 一 条 规则 都 形 如 uv, Hue Vv", 


Aime CV UY) 
4. 证 明 递归 可 枚 举 语言 对 于 下 面 的 运算 是 封闭 的 : 

a) 并 

b) 交 

c) 连接 

d) 克 林 星 闭 包 

e 同 态 像 
5. 设 M 是 图 灵机 ala 


a) 给 出 描述 LOM) 的 一 个 正则 表达 式 。 
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b) 使 用 定理 10.1.3 中 的 技术 ， 给 出 一 个 接收 L( M) 的 无 限制 文法 的 规则 。 
c) 当 输 入 字符 串 是 aba 的 时 候 ， 写 出 M 的 运算 过 程 ， 并 给 出 在 文法 G 中 的 推导 过 程 。 
6. 设 G 是 上 下 文 有 关 文 法 : 
G: SeSBA|a 
BA—AB 
aA—aaB 
B—b 
a) 给 出 aabb 的 推导 过 程 。 
b) 什么 是 L(G)。 
c) 构造 一 个 上 下 文 无 关 文法 用 来 生成 L(G) 。 
7. 设 语言 工 是 {a b"a | i»0], 
a) 使 用 上 下 文 无 关 文法 的 泵 引 理 来 证 明 语言 L 不 是 上 下 文 无 关 的 。 
b) 构造 一 个 能 够 生成 语言 工 的 上 下 文 有 关 文 法 G。 
c) 给 出 文法 G 中 aabbbbaa 的 推导 。 
d) 构造 一 个 接收 工 的 LBA M, 
e) 当 输 入 字符 串 是 aabbbbaa 的 时 候 ， 写 出 M 的 运算 过 程 。 


'8. 设 工 是 1awc | 0<i<j<k}, 


a) 工 不 是 上 下 文 无 关 的 。 能 够 使 用 上 下 文 无 关 文法 的 泵 引 理 对 其 进行 证 明 吗 ? 如 果 能 ， 则 证 明之 ， 否 
则 ， 证 明 泵 引力 不 能 够 确定 L 不 是 一 个 上 下 文 无 关 的 。 
b) 给 出 一 个 能 够 生成 L 的 上 下 文 有 关 文 法 。 
9. 设 M 是 一 个 字母 表 为 五 的 LBA, 略 述 一 个 通用 的 方法 来 构造 用 于 模拟 M 运算 的 单调 规则 集 。 文法 的 规 
则 需要 包含 下 面 集 合 中 的 变量 : 
[Lax], Lai, 1 La,x)], L1, G0 2. Lai) La au x] La), lga], Laga], 
[a xa) ] lage (x) ], La, (4,32 ], La, (x41) ]] , 
K'PaeZX,xerTHa eQ. XE T EH 10.3.3 中 文法 的 构造 。 


“10. Buy 是 一 条 单调 规则 ， 构 造 一 系列 能 够 定义 与 uv 一 样 的 字符 串 的 转换 的 单调 规则 ， 其 中 每 一 条 


规则 的 右 半 边 有 长 度 最 多 为 2 的 字符 串 。 

V. 定义 一 系列 的 上 下 文 有 关 规 则 hv 一 zawv， 这 些 规 则 能 够 定义 出 如 同 单调 规则 AB CD 一 样 的 字符 串 的 
转换 。 提 示 : 这 一 系列 规则 包含 三 条 规则 就 足够 了 ， 其 中 每 一 条 的 左 半 边 和 右 半边 的 字符 串 长 度 均 
为 2。 

12. 使 用 第 10 题 和 第 11 题 的 结果 ， 来 证 明 每 一 个 上 下 文 有 关 语言 都 被 这 样 一 个 文法 生成 ， 这 个 文法 中 ， 每 
一 条 规则 都 具有 uAv—uwv 的 形式 , Kr we(VUX)'Bu,ve(VUX)', 

“13. 设 工 是 一 个 满 二 又 树 。T 中 的 一 条 路 是 一 系列 的 左下 (Z) 、 右 下 (R) 或 者 上 升 (U) 操 作 。 因此 一 条 路 
径 能 够 用 二 = |L,R, Cl 上 的 字符 串 来 标识 。 考 虑 语言 L= ijweZ | w 描述 了 从 根 开始 的 最 后 又 返回 根 
的 一 条 路 径 | PN, X, LU 和 LRUULUeL 并 和 且 U, LRU EL, ASE L 在 乔 姆 斯 基层 次 中 的 位 置 。 

14. 证 明 上 下 文 有 关 语 言 在 任意 同 态 下 不 是 封闭 的 。 如 果 AU) = 表明 wu = 入 ， 那 么 说 明 一 个 同 态 是 入 无 关 
的 。 证 明 上 下 文 有 关 文法 在 入 无 关 同 态 运 算 下 是 封闭 的 。 


15. 设 工 是 己 上 的 一 个 递归 可 枚 举 语言 ， 且 c BAGS, ced, ULT EEXE L U lc] 上 的 一 个 上 下 文 有 关 


语言 L'， 且 对 于 每 一 个 we DL", wel, 4AM 4M FHL i202 wc eL', 

16. 证 明 每 一 个 递归 可 枚 举 语言 是 某 个 上 下 文 有 关 语言 的 同 态 像 。 提 示 : 使 用 练习 15。 

17. 一 个 文法 被 称 为 带 删除 的 上 下 文 有 关 文 法 ， 如 果 每 一 条 规则 都 形 如 uAv—uvw, HipAeV, 下 wwwe 
(VUS)* 。 证 明 这 一 类 文法 可 生成 递归 可 枚 举 语 言 。 

18. 一 个 线性 有 界 自动 机 是 确定 型 的 ， 如 果 对 于 每 一 个 状态 以 及 带 符号 ， 最 多 有 一 个 状态 转换 。 证 明 每 一 
个 上 下 文 无 关 语言 都 能 够 被 一 个 确定 型 线性 有 界 自动 机 所 接收 。 
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19. 设 工 是 一 个 上 下 文 有 关 语言 ， 且 能 够 被 一 个 确定 型 线性 有 界 自 动机 所 接收 。 证 明 工 是 上 下 文 有 关 的 。 
要 记 住 ， 在 一 个 任意 的 确定 型 线性 有 界 自动 机 中 的 计算 是 不 需要 停机 的 。 


参考 文献 注释 


乔 姆 斯 基层 次 是 由 乔 姆 斯 基 [1956, 1959] 提出 的 。 这 篇 文章 包含 了 无 限制 文法 能 够 产生 递归 可 枚 举 
语言 的 证 明 。 线 性 有 界 自动 机 由 Myhill [1960] 提出 。 线 性 有 界 自动 机 与 上 下 文 有 关 语 言 之 间 的 关系 是 由 
Landweber [1963] 和 Kuroda [1964] 发 展 的 。 练习 10、 练 习 11 和 练习 12 的 解决 方法 ， 能 够 从 Kuroda 
[1964] 中 找到 ， 这 些 方案 展示 了 单调 性 和 上 下 文 有 关 文 法 之 间 的 关系 。 


第 11 章 ， 判 定 问题 与 乒 奇 一 图 灵 论题 


在 前 几 章 中 ， 我 们 利用 图 灵机 来 进行 字符 串 的 模式 识别 ， 识 别 各 种 语言 ， 完 成 函数 的 计算 。 然 而 ， 很 
多 有 意义 的 问题 是 比 字符 串 的 识别 和 处 理 高 一 个 层次 的 。 例 如 ， 我 们 可 能 对 如 下 这 类 的 问题 的 答案 感 兴 趣 : 
“这 个 自然 数 是 否 为 一 个 完全 平方 数 ?”， 或 者 “一 个 图 中 是 否 存在 环 路 ?”， 又 或 者 “图 灵机 执行 该 运算 是 
否 会 在 20 次 转换 之 内 停机 ?”。 所 有 这 一 类 的 问题 都 描述 了 一 个 判定 问题 。 
产 格 来 说 ， 一 个 判定 问题 P〈decision problem P) 是 指 一 系列 答案 为 “是 ”或 者 为 “ 否 ” 的 问题 。 
判定 一 个 自然 数 是 否 为 一 个 完全 平方 数 包含 了 如 下 的 问题 : 
po: 0 是 否 为 一 个 完全 平方 数 ? 
Pi: 1 是 否 为 一 个 完全 平方 数 ? 
pi: 2 是 否 为 一 个 完全 平方 数 ? 


每 个 单独 的 问题 都 是 该 判定 问题 的 一 个 实例 。 判 定 问 题 P 的 解决 方法 是 指 对 判定 问题 的 每 个 实例 
都 能 给 出 正确 答案 的 算法 。 如 果 一 个 判定 问题 存在 解决 方法 ， 那 么 该 问题 是 可 判定 的 (decidable) 。 

既然 对 于 判定 问题 的 解决 方法 是 一 个 算法 ， 那么 接 下 来 有 必要 对 算法 计算 这 个 直观 的 概念 进行 简 
要 的 回顾 。 我 们 还 没有 定义 ,而且 也 没有 办 法 精确 地 定义 算法 (algorithm) 这 个 概念 。 这 个 概念 就 属 
于 “我 无 法 描述 它 ， 但 是 当 我 看 到 的 时 候 ， 我 能 知道 是 它 ”的 概念 类 型 。 但 是 ,我 们 可 以 列 出 算法 这 
个 概念 所 具有 的 一 些 基本 属性 。 能 够 解决 判定 问题 的 算法 应 该 具有 以 下 的 特征 ; 

o TEE: 它 应 该 能 够 对 每 个 问题 的 实例 产生 正确 的 结果 。 

* PUE: 它 应 该 包含 一 个 有 限 的 指令 序列 ， 而 且 每 条 指令 的 执行 都 不 需要 任何 的 洞察 力 、 创 造 

性 和 猜测 。 

MEE: 面 对 同 样 的 输入 ， 它 应 该 每 次 都 执行 同样 的 计算 。 
如 果 某 过 程 能 够 满足 上 述 的 属性 ， 那 么 我 们 就 称 它 为 有 效 的 。 

标准 的 图 灵机 的 计算 通常 是 机 械 的 并 且 是 确定 的 。 而 对 每 个 输入 字符 串 都 能 够 停机 的 图 灵机 是 完 
整 的 。 因 为 图 灵机 能 够 有 效 地 执行 计算 ， 我 们 将 使 用 它 作 为 解决 判定 问题 的 框架 。 我 们 可 以 将 问题 的 
实例 转换 成 图 灵机 的 输入 字符 串 来 构成 对 判定 问题 的 表述 。 如 果 一 个 输入 字符 串 被 接收 了 ， 那 么 与 其 
相对 应 的 问题 实例 的 答案 就 是 肯定 的 ， 反之， 问题 的 答案 就 是 否定 的 。 

丘 奇 一 图 灵 论 题 证 明了 : 对 于 每 个 可 以 通过 有 效 过 程 解决 的 判定 问题 ， 都 可 以 通过 设计 图 灵机 来 
解决 。 关 于 丘 奇 一 图 灵 论题 的 一 个 更 一 般 性 的 解释 是 这 样 的 : 任何 可 以 通过 算法 表述 的 计算 过 程 都 可 
以 通过 设计 图 灵机 来 实现 。 本 章 首先 在 不 同 的 判定 问题 、 图 灵机 和 递归 语言 之 间 建 立 联系 。 本 章 其 他 
的 部 分 提出 了 丘 奇 一 图 灵 论 题 ， 并 且 讨 论 了 此 论断 的 重要 性 和 影响 。 


11. 1 判定 问题 的 描述 


利用 图 灵机 来 解决 判定 问题 的 第 一 步 是 将 问题 表示 成 可 接收 的 字符 串 。 这 需要 为 问题 构造 一 个 合 
适 的 描述 。 读 者 可 以 回忆 一 下 在 第 5 章 开 头 所 描述 的 报纸 自动 贩卖 机 。 要 打开 贩卖 机 上 面 的 锁 ， 需 要 
30 美 分 的 硬币 〈 由 面值 为 5 美 分 、10 美 分 和 25 美 分 的 硬币 组 成 ) 。 如 果 输入 的 金额 超过 了 30 美 分 ， 
贩卖 机 就 会 保留 所 有 的 输入 。 为 了 防止 一 个 音 雷 鬼 想 要 购买 报纸 但 却 拒绝 支付 所 必需 的 最 少 金额 ， 我 
们 需要 提供 一 个 有 效 的 过 程 来 判断 输入 的 各 种 硬币 的 总 金额 是 否 达到 了 30 美 分 。 

为 了 利用 图 灵机 解决 音 青 鬼 问题 ， 必 须 将 用 自然 语言 描述 的 问题 实例 表示 成 一 个 等 同 的 字符 串 接 
收 问题 。 我 们 可 以 将 一 组 硬币 表示 成 |n,d,q}“ ， 这 里 表示 的 是 面值 为 5 美 分 的 硬币 ，d 表示 的 是 面 
值 为 10 美 分 的 硬币 ，g 表示 的 是 面值 为 25 美 分 的 硬币 。 利 用 这 种 表示 方式 ， 我 们 可 以 利用 图 灵机 来 
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对 音 音 鬼 问 题 的 输入 进行 判断 ， 从 而 接收 gann, nddnd 这 样 的 输入 ， 并 且 拒 绝 nnnd 和 qdqdqqq 这 样 的 
输入 。 在 练习 1 中 ,读者 可 以 自己 构造 图 灵机 来 解决 这 个 问题 。 [344| 
图 11-1 给 出 了 利用 图 灵机 来 构造 判定 问题 解决 方法 的 两 大 步骤 。 第 一 步 是 选择 字母 表 ， 并 且 为 问 
题 的 实例 提供 字符 串 形式 的 表示 。 问 题 表示 的 性 质 对 于 接 下 来 图 灵机 的 设计 很 有 帮助 。 下 面 我 们 将 通 
过 “判定 一 个 自然 数 是 否 为 偶数 ”这 个 问题 ， 来 对 问题 表示 方式 所 带 来 的 影响 进行 解释 。 表 示 自 然 数 
通常 有 两 种 方法 : 一 元 表示 和 二 进 制 表示 。 采 用 一 元 表示 的 字母 表 为 111 ， 而 数字 n 则 表示 成 1"*'。 

如 果 采 用 二 进 制 来 进行 表示 ， 那 么 字母 表 是 10,1| 。 


问题 实例 图 灵机 输入 答案 








p Wr 





P 





Wi 





P, 





Ws 





表示 图 灵机 计算 


D, 








是 / 否 


图 11-1 判定 问题 的 解决 方法 
图 灵机 采用 一 元 法 来 解决 偶数 问题 。 状 态 q 和 q, 分 


1/1 R 
别 记录 了 已 经 处 理 的 1 是 侦 数 个 还 是 奇数 个 。 在 一 元 表 O 1a @ = —*@) 
示 法 里 面 ， 长 度 为 奇数 的 字符 串 代表 了 一 个 偶数 。 因 此 ， "Tw 
M, 表示 的 语言 为 11 | i 为 奇数 | 。 
0/0 R 
I1 R 


T) B/B R » BIBL © 0/0 R 


如 果 利用 二 进 制 表示 ， 那 么 一 个 偶数 的 最 右边 一 位 为 0， 图 灵机 也 就 能 够 接收 这 样 的 输入 字符 串 。 1345| 
M, 和 Mz, 策略 的 不 同 解释 了 图 灵机 对 于 不 同 表示 方式 的 依赖 。 

将 判定 问题 表示 为 字符 串 有 很 多 不 同 的 方式 8。 如 果 至 少 有 一 种 表示 方法 和 图 灵机 的 组 合 能 够 解决 
一 个 判定 问题 ， 那 么 该 问题 就 有 一 个 图 灵机 的 解决 方法 。 当 然 ， 一 个 判定 问题 也 可 能 有 很 多 种 表示 方 
法 和 图 灵机 的 组 合 来 解决 它 。 


11.2 判定 问题 和 递归 语言 


我 们 已 经 选择 标准 图 灵机 作为 解决 判定 问题 的 形式 化 工具 。 一 旦 我 们 选 定 了 用 来 描述 问题 实例 的 字 
FE, 那么 接 下 来 需要 做 的 就 是 利用 图 灵机 来 对 输入 的 字符 串 进行 分 析 。 既然 完整 性 要 求 图 灵机 对 每 个 
输入 的 字符 串 都 能 够 停机 ， 那 么 该 图 灵机 能 够 接收 的 语言 应 该 是 递归 的 。 因 此 ， 每 个 利用 图 灵机 来 解决 
的 判定 问题 都 定义 了 一 种 递归 语言 。 相 应 地 ， 每 个 递归 语言 工 也 可 以 被 视 为 某 个 判定 问题 的 解决 方法 。 
因此 ， 判 定 问题 就 可 以 被 视 为 语言 的 成 员 问题 : 即 对 于 字母 表 L 上 的 字符 串 w,“w 是 否 存 在 于 L 中 ”。 

借助 于 判定 问题 和 递归 语言 之 间 的 关联 ， 我 们 可 以 拓展 用 于 检测 判定 问题 的 可 判定 性 的 技术 。 既 
然 确定 型 多 道 和 多 带 机 器 的 计算 能 够 在 标准 图 灵机 上 进行 模拟 ， 那 么 利用 这 类 机 器 也 可 以 给 出 一 个 问 
题 的 可 判定 性 。 
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例 11.2.1 “一 个 自然 数 是 否 为 一 个 完全 平方 数 ” 这 个 问题 是 可 判定 的 。 在 前 面 例 8. 6. 2 
SERIA REM Re RARE IE 

确定 型 是 算法 的 一 个 基础 性 质 。 然 而 ,通常 情况 下 ， en 
机 要 比 设计 一 个 确定 型 的 图 灵机 容易 。 在 8.7 节 中 ， 我们 已 经 证 明了 任何 可 以 被 非 确定 型 图 灵机 接收 的 
语言 同样 可 以 被 确定 型 的 图 灵机 所 接收 。 而 判定 问题 的 解决 方法 不 仅仅 要 求 能 够 接收 一 种 语言 ， 而 且 还 
要 求 对 所 有 的 计算 都 能 够 停机 。 一 个 对 所 有 计算 都 停机 的 非 确定 型 图 灵机 可 以 用 来 构造 一 个 判定 的 过 
程 。 而 这 些 图 灵机 所 接收 的 语言 都 是 递归 的 ( 例 8. 23) ， 从 而 保证 存在 一 个 完整 的 确定 的 解决 方法 。 

例 11.2.2 我 们 利用 非 确定 性 来 表明 问题 “有 向 图 中 是 否 存在 从 节点 v, 到 节点 v 的 路 径 ”是 可 

346 判定 的 。 一 个 有 向 图 包含 了 一 组 节点 N = |v,…,v,| 和 边 ACN xN。 我 们 使 用 (0, 1} 来 作为 表示 图 

的 字母 表 。 节 点 v 表示 为 1”， 而 有 向 边 [v,，v,] 表 示 为 en(v,)0en(v,)， 其 中 en(v,) 和 en(v,) 分 别 是 
节点 v 和 节点 v, 的 编码 。 字 符 串 00 被 用 来 分 隔 各 个 有 向 边 。 

对 于 图 灵机 的 输入 包括 了 利用 上 述 方法 对 于 节点 和 有 向 边 的 编码 。 那 么 ， 有 向 图 





N={v,, v, Va} 


A- ([v, val [vi v], [vs vi], [vn val} C) (v) 


可 以 表示 为 110111001101100111011110011110111。 这 里 使 用 000 来 分 隔 要 判定 的 问题 和 图 灵机 的 表 
示 ， 判 定 图 中 是 否 存在 3l v, 的 路 径 的 输入 为 : 1101110011011001110111100111101110001111011 。 
我 们 使 用 非 确 定 的 双 带 图 灵机 M 来 解决 路 径 问 题 。 图 灵机 M 的 动作 如 下 : 
1. 首先 对 输入 进行 检查 来 确定 是 否 输入 的 格式 代表 了 一 个 有 向 图 以 及 两 个 用 来 计算 路 径 的 节点 。 
如 果 格 式 不 满足 要 求 ， 那 么 图 灵机 M 停机 ， 并 且 拒 绝 字符 串 。 
2. 如 果 图 灵机 的 输入 为 R(G)000en(v,)0en(v)， 这 里 R(G) 是 有 向 图 G HRR, MAWE v, = 
v;， 图 灵机 在 接收 状态 停机 。 
3. 将 节点 v, 的 编码 添加 0 写 在 2 号 带 上 。 
4. (Bit v, 是 2 号 带 上 最 右边 的 节点 。 从 R(G) 中 随机 地 选取 一 条 从 v, 到 v, 的 有 向 边 。 如 果 这 样 
的 有 向 边 不 存在 或 者 v 已 经 在 2 号 带 上 进行 了 编码 ， 那么 图 灵机 在 拒绝 状态 停机 。 
5. 如 果 =v;， 那 么 图 灵机 在 接收 状态 停机 。 否 则 ,将 en(v,)0 写 人 到 2 号 带 的 尾 端 ， 并 重复 第 4 
步 的 计算 步骤 。 
步骤 4 和 5 能 够 在 2 号 带 上 产生 以 节点 v 开始 的 路 径 。 因 为 步骤 4 保证 了 只 有 无 环 的 路 径 才 能 写 
在 2 号 带 上 ， 所 以 图 灵机 M 的 所 有 计算 都 会 停机 。 同 样 ， 我 们 可 以 知道 L(M) 是 递归 的 ， iscing a 
是 可 以 判定 的 。 
NDA ROS a RUD ND HERR T. toga MUR 
定义 的 方法 ， 我 们 可 以 将 例 11.2. 2 表述 成 : 
有 向 图 的 路 径 问 题 
输入 : 有 向 图 G=(N,A), WA v, veN : 
输出 : 是 ， 如 果 在 G 中 存在 一 条 从 六 到 的 路 径 
否 ， 其 他 情况 
[341] 既然 可 解决 的 判定 问题 和 递归 语言 之 间 存 在 着 这 样 的 对 应 关系 ， 那 我 们 应 该 将 其 称 之 为 问题 还 是 
语言 呢 ? 在 这 里 ， 我 们 约定 : 当 使 用 一 个 较 高 层次 的 概念 来 描述 问题 的 时 候 ， 我 们 使 用 判定 问题 。 当 
利用 字符 串 的 接收 来 描述 问题 ， 并 且 将 问题 实例 的 表述 转化 为 字符 串 的 时 候 ， 我 们 使 用 递归 语言 来 描 
述 。 无 论 使 用 哪 种 表示 ， 如 果 存 在 算法 能 够 对 问题 的 每 个 实例 给 出 正确 的 回答 ， 或 者 对 每 个 字符 串 的 
成 员 资 格 给 出 正确 的 判断 ， 那 么 这 个 问题 是 可 判定 的 。 
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11.3 问题 归 约 


归 约 是 一 种 解决 问题 的 技术 。 对 于 一 个 新 问题 ， 归 约 技术 可 以 用 来 避免 “重头 再 来 "。 归 约 的 目标 是 
将 新 问题 的 实例 转换 为 我 们 了 解 并 已 解决 的 问题 形式 。 归 约 技术 是 我 们 给 出 问题 可 判定 性 的 一 个 有 效 
的 工具 。 同 时 ， 在 第 12 章 中 我 们 还 会 看 到 ， 可 以 利用 归 约 来 证 明 有 些 问题 是 没有 算法 可 以 解决 的 。 

定义 11.3.1 假设 LL 是 定义 在 ,上 的 语言 ,而 Q 是 定义 在 吕 , 上 的 语言 。 如 果 存 在 一 个 图 灵 可 
计算 的 函数 r: LOLs eH wel 当 且 仅 当 r(w) sQ， 那 么 我 们 称 工 可 以 多 对 一 归 约 (many-to- 
one-reducible) 到 Q。 

如 果 一 个 语言 L 可 以 通过 函数 > 被 归 约 到 可 判定 的 语言 Q， 那 么 是 可 判定 的 。 假 设 R 是 执行 归 
约 的 图 灵机 ， 而 M 是 接收 Q 的 图 灵机 。 那 么 将 ;上 的 字符 串 在 R 和 M 上 顺序 执行 就 可 以 判定 工 的 


成 员 问 题 。 
wi r 是 
oil “cs 


读者 应 该 注意 到 ， 用 于 归 约 的 图 灵机 R 既 不 能 判定 工 的 成 员 资格 也 不 能 判定 Q 的 成 员 资格 ; 它 仅 仅 
是 将 字符 串 从 i FREI, 。Q 中 的 成 员 资格 可 以 通过 M 来 判定 ， 而 工 的 成 员 资格 是 由 R 和 M 联 
合 在 一 起 判定 的 。 

为 了 解释 从 一 个 语言 到 另外 一 个 语言 的 转化 ,我们 将 工 = | x'y'z'| i20, kz0] 转化 为 Q = (ab | 
iz0] 。 转 化 的 规则 在 下 面 的 表 中 给 出 。 





归 约 输入 条 件 

L= [x'y'z | iz0,k20)| weix,yz* weL 
到 ir 当 且 仅 当 
Q= |aib' | iz0| ve la, b]* r (w) eQ 


我 们 将 字符 串 we {x,y,z} 按照 如 下 的 步骤 转化 为 rw) ela,b]" : 
i) 如 果 在 一 个 z 字 符 之 后 w 中 没有 字符 x 和 字符 y 出 现 ， 则 将 每 个 x 替换 为 a, 将 每 个 y 替换 为 
b, FEK z 擦 除 。 
ii) 如 果 在 一 个 z 字 符 之 后 w 中 还 有 字符 x 和 字符 y 出 现 ， 则 将 整个 字符 串 擦 除 ， 并 在 输入 的 位 
置 写 上 一 个 as 
接 下 来 的 这 个 表格 给 出 了 二 中 一 些 字符 串 的 转化 后 的 结果 。 





we Zr BEE LH r(w)e Xi 是 否 在 Q 中 
xxyy 是 aabb 是 
XXyyzaz 是 aabb 是 
yxxyz 8 baab E 
xxzyy 否 a 否 
Zzyzx fi a 78 
À 是 入 是 
zz 是 X 是 


上 面 的 例子 解释 了 为 什么 我 们 将 归 约 称 为 多 对 一 的 转换 ， 在; 中 的 多 个 字符 串 可 能 映射 到 习 ” 上 的 
同一 个 字符 串 。 
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图 灵机 





将 工 归 约 到 Q。(xzUy) "z 形式 的 字符 串 将 在 状态 % 和 状态 qg 被 识别 出 来 ， 并 转换 到 状态 wy 。 而 在 z 
之 后 有 x 或 者 y 的 字符 串 都 将 在 状态 q 被 擦 除 ， 并 且 在 带 上 写 上 a 并 转化 到 qro 

例 11.3.1 下 面 来 考虑 语言 L=|uu| wu=a'b'c',i>0| 中 的 字符 串 接 收 问题 。 在 例 8.2.2 中 的 图 灵 
机 能 够 接收 {ab'c',i=0} 。 我 们 这 里 将 工 的 成 员 问题 归 约 到 a bc! 单个 实例 的 识别 问题 ， 这 样 就 可 以 
通过 将 归 约 步骤 和 例 8. 2. 2 中 的 图 灵机 M 组 合 起 来 加 以 解决 原来 的 问题 。 归 约 的 步骤 如 下 : 

L 拷贝 输入 的 字符 串 w。 利用 拷贝 得 到 的 字符 串 来 确定 是 否 存在 字符 串 we la b.c] ' 满 足 w = uu。 

2. 如 果 w 寺 uu， 那么 将 带 进行 擦 除 ， 并 且 在 输入 的 位 置 写 上 一 个 a。 

3. 如 果 w=uu， 那 么 将 拷贝 的 字符 串 和 输入 字符 串 中 的 第 二 个 u BER, EENE a 
4f tts 

如 果 输 入 的 字符 串 w 是 uu 格式 的 ， 那么 weL 当 且 仅 当 w=aib'ic'。 归 约 过 程 中 并 不 检查 字符 a、 
b. c 的 个 数 和 先后 顺序 ， 这 些 都 是 由 例 8. 2. 2 中 的 图 灵机 来 完成 的 。 

如 果 字 符 串 w 不 具有 uu 格式 ， 那么 归 约 过 程 就 会 产生 一 个 字符 串 a。 这 个 字符 串 接 下 来 将 会 被 
8.2. 2 中 的 图 灵机 M 拒绝 ， 从 而 表明 字符 串 w 不 在 工 中 。 E 

如 果 能 够 将 问题 P 的 问题 实例 转化 为 问题 Q 的 实例 ， 同 时 还 能 保证 答案 的 正确 性 ， 那 么 我 们 称 一 
个 判定 问题 P 可 以 通过 多 对 一 归 约 到 问题 Q。 换 一 个 角度 来 说 ， 归 约 就 是 转化 表述 问题 实例 的 字符 
Po 通常 情况 下 ， 如 果 我 们 能 够 在 字符 串 级 别 上 完成 这 种 转换 ， 那 么 就 可 以 直接 根据 问题 实例 来 定义 
归 约 。 对 于 这 种 技术 以 及 字符 串 表示 形式 所 带 来 的 影响 ， 我 们 将 在 接 下 来 的 例子 中 加 以 说 明 。 

例 11.3.2 我 们 接 下 来 描述 在 例 11.2. 2 中 引入 的 有 向 图 中 的 路 径 问 题 ， 它 可 以 被 归 约 为 : 

确定 节点 的 环 问题 (CEN) 
输入 : 有 向 图 G=(N,A)， 节 点 wEN 
输出 : 是 ， 如 果 在 G 中 有 一 个 环 包含 v 
$8; 其 他 情况 。 

归 约 过 程 需要 从 G 构造 G' ， 使 得 在 G 中 包含 一 条 从 到 v 的 路 径 就 等 同 于 在 G' 中 有 一 个 包含 的 
vi 环 。 归 约 的 第 一 步 是 为 路 径 问 题 的 起 始点 v 找到 在 CFN 问题 中 的 内 。 当 选择 了 v, 作为 CEN 问题 中 
的 节点 v, Za, HARMS WAH: 





RAE 实例 条 件 
Path 问题 E G, WAY, v; Gd v; Bl v; 的 路 径 ， 
到 ir : 当 且 仅 当 


CEN 问题 ALG’, TAV G' 中 有 一 个 包含 v; 的 环 
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图 G' 可 以 通过 修改 图 G 而 得 到 : 

i) 删除 所 有 以 v; 为 目标 节点 的 有 向 边 [w v] 。 

ii) 加 入 一 条 边 [vy ,vi]。 
如 果 在 图 G 中 有 v 到 v 的 路 径 ， 那么 必然 存在 一 条 以 v, 为 起 点 且 只 经 过 一 次 v, 的 路 径 。 因 此 ， 删 除 
有 向 边 [v,,v;] 并 不 会 影响 是 否 存 在 从 v, 到 vw 的 路 径 。 在 第 一 步 删除 了 所 有 以 vv 为 目标 节点 的 有 向 边 
之 后 ， 图 G 中 就 不 会 有 包含 w 的 环 ， 因 为 已 经 没有 以 v 为 目标 节点 的 有 向 边 了 。 

在 第 二 步 加 入 有 向 边 [vj ,vi] 带 来 的 影响 是 : 在 原 图 G 中 存在 一 条 从 六 到 的 路 径 当 且 仅 当 在 图 
G' 中 存在 包含 v, 的 环 。 这 样 我 们 就 将 有 向 图 中 的 路 径 问 题 修 改 为 CEN 问题 了 。 

将 例 11. 2. 2 中 路 径 问题 的 实例 G. v Aly, 进行 归 约 ， 可 以 得 到 : 


« & (9... «9 © 


既然 在 G 中 没有 从 v Bl v, 路 径 ， 那么 在 G' 中 就 没有 包含 v 的 环 。 

在 图 灵机 的 层次 上 ，CFN 问题 的 实例 包含 了 图 G' 和 节点 v, 并且 可 以 被 表示 为 R(G)000en(v)。 
为 了 将 路 径 问题 中 的 G、w 和 v 实例 归 约 为 CEN 问题 中 的 G' 和 vs， 我 们 要 做 如 下 的 转换 : 

R(G)000en(v,)en(v,) 21101110011011001110111100111101110001111011 

到 R(G')000en(v,) 2110111001101100111011110011110110001111 

执行 归 约 的 图 灵机 应 该 从 输入 中 删除 所 有 进入 v; 的 有 向 边 ， 增 加 从 v, 到 v, 的 有 向 边 ， 并 且 从 输 
和 人 的 末尾 擦 除 w。 ' 口 

将 判定 问题 P 归 约 到 可 判定 的 判定 问题 Q 表明 了 问题 P 也 是 可 判定 的 。 通 过 将 归 约 过 程 和 解决 Q 
的 算法 顺序 连接 起 来 就 可 以 得 到 了 的 解决 方法 。 


11.4 丘 奇 一 图 灵 论 题 


算法 计算 并 不 一 个 很 新 的 概念 。 实 际 上 ， 算 法 这 个 词 最 早 由 8 世纪 阿拉 伯 的 数学 家 Abu Ja'far Mu- 
hammad ibn Musaal- Khwarizami 提出 。 在 Musaal- Khwarizami 的 著作 中 ， 他 提出 了 一 组 解决 线性 问题 和 
二 次 问题 的 规则 。 这 本 书 被 认为 是 最 早 的 代数 著作 。 几 个 世纪 以 来 ， 人 们 习惯 于 使 用 一 些 按 步 执行 的 
机 械 过 程 来 描述 计算 、 处 理 和 数学 推断 。 在 19 世纪 早期 ,这 种 不 太 正 式 的 使 用 方法 开始 走向 成 
熟 一 一 数学 家 们 开始 尝试 着 准确 地 定义 算法 计算 的 含义 、 能 力 以 及 局 限 性 。 

对 于 计算 能 力 的 探索 使 得 一 系列 执行 算法 计算 的 方法 和 形式 化 理论 开始 出 现 。 数 学 家 们 取得 了 很 
多 的 成 果 : 可 以 通过 定义 字符 串 转化 规则 ， 通 过 对 函数 进行 估计 ， 通 过 抽象 计算 机 ， 以 及 通过 编写 高 
级 语言 中 的 程序 来 实现 高 效 的 过 程 。 这 类 系统 的 例子 包括 : 

o FFF BEL: Post 系统 [ Post, 1936], Markov 系统 [Markov，1961 ] ， 非 限制 文法 。 

e 函数 的 估计 : 部 分 入 递归 函数 [Gödel, 1931; Kleene，1936] ,演算 [Church, 1941], 

e 抽象 计算 机 : 注册 机 [Shepherdson, 1963], ， 图 灵机 。 

© 编程 语言 : while 程序 [Kfoury et al. , 1982 ], 259 章 中 的 TM, 
在 最 后 一 种 类 别 中 列 出 的 while 程序 ， 是 采用 一 种 很 小 的 编程 语言 来 编写 的 程序 。 该 语言 仅仅 包括 赋 
值 、 条 件 以 及 for 和 while 语句 。 尽 管 while 程序 为 了 便于 对 程序 进行 分 析 而 仅 包含 很 少 的 语句 形式 ， 
不 过 它 却 和 C、C++ 以 及 Java 这 类 标准 的 编程 语言 有 着 相同 的 计算 能 力 。 

目前 ， 我 们 使 用 图 灵机 作为 解决 判定 问题 的 计算 框架 ; 然而 ,我 们 同样 可 以 选择 其 他 的 算法 系 
统 。 但 是 这 样 做 ， 会 不 会 影响 我 们 解决 问题 的 能 力 呢 ? 理想 的 答案 应 该 是 否定 的 问题 解决 方法 的 
存在 与 否 应 该 是 问题 自身 的 特征 ， 而 不 应 该 是 我 们 选择 的 算法 系统 所 产生 的 制品 。 丘 奇 一 图 灵 论 题 验 
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证 了 这 一 点 。 

那么 前 面 提 到 的 算法 系统 有 什么 样 的 共同 点 呢 ? 这 些 算法 都 可 以 执行 同样 的 计算 。 这 个 结论 是 值 
得 注意 的 ， 因 为 这 些 系统 在 设计 的 时 候 是 用 来 对 不 同类 型 的 数据 执行 不 同类 型 操作 的 。 然 而 ， 读 者 已 
经 在 前 文中 看 到 了 它们 等 价 的 一 个 例子 ， 并 且 将 在 第 13 章 中 看 到 另外 一 个 例子 。 在 10. 1 节 中 ,我 们 
证 明了 图 灵机 的 计算 可 以 通过 非 限 定 文法 来 进行 模拟 。 因 此， 任何 由 非 限定 文法 所 定义 的 语言 都 能 够 
被 图 灵机 所 接收 。 在 第 13 章 中 ,我 们 将 给 出 算法 方法 的 定义 ， 并 对 Godel 和 Kleene 提出 的 数论 函数 
进行 评价 。 这 种 方法 具有 和 图 灵机 相同 的 功能 。 

很 多 计算 方法 所 产生 的 系统 都 具有 相同 的 计算 能 力 。 这 个 事实 让 我 们 相信 这 些 系 统 能 够 定义 算法 
计算 能 力 的 边界 。 算 法 和 执行 计算 的 系统 是 不 可 分 割 的 。 然 而 ， 对 于 这 些 系统 来 说 ， 它 们 的 能 力 有 -一 
个 明确 定义 的 边界 。 丘 奇 一 图 灵 论 题 对 算法 计算 的 能 力 和 限制 进行 了 形式 化 的 表述 。 我 们 接 下 来 首先 
对 丘 奇 一 图 灵 论 题 进行 解释 。 

判定 问题 中 的 丘 奇 一 图 灵 论 题 判定 问题 存在 有 效 的 解决 过 程 当 上 且 仅 当 图 灵机 能 够 对 问题 所 有 的 
输入 停机 并 且 能 够 给 出 正确 的 答案 。 

判定 问题 的 解决 方法 需要 对 每 个 问题 实例 的 计算 都 返回 正确 的 答案 。 如 果 放 宽 了 这 个 限制 ,那么 
我 们 得 到 的 就 是 判定 问题 的 部 分 解决 方法 。 一 个 判定 问题 P 的 部 分 解决 方法 并 不 具有 完整 性 ， 但 是 它 
能 够 对 每 个 结果 为 “是 ”的 判定 问题 实例 peP 做 出 正确 的 反应 。 而 如 果 问题 的 答案 是 否定 的 ， 那 
么 计算 过 程 或 者 返回 否定 的 结果 ， 或 者 不 能 够 产生 结果 。 也 就 是 说 ， 计 算 仅仅 能 够 识别 正确 的 实例 。 

正如 我 们 可 以 将 判定 问题 的 解决 方案 转化 为 递归 语言 的 成 员 问 题 一 样 ， 判 定 问题 的 部 分 解决 方法 
同样 等 同 于 一 个 递归 可 枚 举 语言 的 成 员 问 题 。 丘 奇 一 图 灵 论 题 同样 包含 了 识别 语言 和 定义 语言 包 
算法 。 

语言 识别 问题 中 的 丘 奇 一 图 灵 论题 判定 问题 P 是 部 分 可 解决 的 ， 当 且 仅 当 有 图 灵机 能 够 接收 问 
题 P 所 有 结论 为 “是 ”的 实例 。 

图 灵机 使 用 带 上 的 符号 来 执行 计算 的 功能 ， 当 图 灵机 停机 的 时 候 ， 带 上 保留 的 就 是 计算 的 结果 。 
解决 判定 问题 的 函数 化 方法 是 使 用 1 和 0 来 分 别 表 示 肯 定 和 否定 的 结果 。 归 约 问题 答案 的 方法 不 会 影 
响 到 存在 图 灵机 解决 方法 的 问题 集合 〈 练 习 9.4) 。 因 此 ， 有 关 可 计算 函数 的 丘 奇 一 图 灵 论 题 包 含 并 
扩展 了 论题 的 前 两 个 版 本 。 

可 计算 函数 中 的 丘 奇 一 图 灵 论 题 ”一 个 函数 了 是 可 以 有 效 计算 的 ， 当 且 仅 当 存 在 图 灵机 能 够 
Tus f. 

第 13 章 ， 我 们 在 图 灵 可 计算 函数 与 递归 函数 之 间 建 立 了 一 致 性 ， 我 们 将 会 给 出 丘 奇 一 图 灵 论 
题 一 个 更 细致 的 版 本 ， 同 时 给 出 一 个 从 可 计算 的 数论 函数 到 可 计算 函数 的 自然 泛 化 过 程 。 

为 了 理解 丘 奇 一 图 灵 论题 的 内 容 ， 我 们 必须 要 理解 断言 的 本 质 。 丘 奇 一 图 灵 论 题 并 不 是 一 个 数学 
定理 ， 它 无 法 被 证 明 。 因 为 证 明 它 需 要 对 “有 效 过 程 ”这 个 直观 的 概念 进行 形式 化 的 定义 。 而 这 个 定 
义 可 能 是 无 法 给 出 的 。 关 于 这 一 点 ， 可 以 通过 设计 一 个 无 法 通过 图 灵机 来 计算 的 有 效 过 程 来 证 实 。 图 
灵机 和 其 他 的 算法 系统 的 等 价 性 ， 图 灵机 体系 结构 的 健壮 性 ， 以 及 无 法 找到 一 个 反例 都 有 力 地 证 明了 
上 面 说 的 过 程 是 无 法 找到 的 。 

丘 奇 一 图 灵 论 题 为 证 明 判 定 算法 的 存在 提供 了 一 条 捷径 。 我 们 可 以 通过 描述 解决 问题 的 有 效 步 又 
来 完成 证 明 ， 而 不 需要 为 判定 问题 建立 一 个 图 灵机 。 丘 奇 一 图 灵 论 题 确保 了 总 会 有 相应 的 图 灵机 来 解 
决 这 个 问题 。 在 表现 图 灵机 计算 能 力 的 过 程 中 ， 我们 一 直 在 隐 式 地 使 用 丘 奇 一 图 灵 论 题 。 对 于 复杂 的 
机 器 ， 我 们 只 是 给 出 图 灵机 计算 动作 的 简要 描述 。 我 们 知道 ， 如 果 需 要 ， 整 个 图 灵机 总 可 以 被 显 式 地 
构造 出 来 。 


11.5 通用 机 


20 世纪 40 年 代 中 期 计算 机 设计 的 一 个 重要 突破 就 是 存储 程序 的 计算 模型 。 早 期 的 计算 机 被 用 来 
执行 一 个 任务 。 输 入 可 能 不 同 ， 但 是 对 于 每 个 输入 执行 的 是 相同 的 程序 。 如 果 对 指令 进行 修改 那么 就 
需要 对 硬件 进行 重新 配置 。 在 存储 程序 的 模型 中 ， 指 令 和 数据 是 以 电子 的 形式 被 装载 到 内 存 中 的 。 在 
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存储 程序 的 计算 机 中 ， 计 算是 从 内 存 中 提取 一 条 指令 并 执行 它 的 循环 过 程 。 

在 前 些 章节 里 面 提 到 的 图 灵机 ， 就 如 同 早期 的 计算 机 一 样 ， 只 能 执行 单个 集合 的 指令 。 图 灵机 的 
体系 结构 中 有 自己 存储 程序 的 概念 ， 这 比 最 早 的 存储 程序 的 计算 机 领先 了 十 年 。 通 用 图 灵机 (univer- 
sal turing machine) 可 以 被 用 来 模拟 任意 图 灵机 M 的 计算 过 程 。 为 了 完成 这 一 点 ， 通 用 图 灵机 的 输入 
必须 包含 图 灵机 M 的 表示 ， 以 及 要 被 处 理 的 字符 串 w。 为 了 简单 起 见 ， 我 们 假设 M 是 能 够 接收 停机 
的 标准 图 灵机 。 通 用 图 灵机 的 活动 可 以 下 面 的 图 来 解释 : 


M 停机 于 w 
MS 通用 图 灵机 接收 
U 循环 
输入 为 w 时 M 不 停机 


图 中 的 R(M) 是 M 的 表示 ， 而 标明 了 loop 的 输出 表明 了 U 的 计算 不 会 终止 。 如 果 M 停机 并 且 接 收 了 
输入 w， 那 么 U 将 执行 同样 的 操作 。 如 果 M 对 于 w 不 停机 ， 那么 U 也 不 停机 。U 之 所 以 被 称 为 通用 
机 ， 是 因为 U 能 够 模拟 任何 的 图 灵机 M., 

构造 通用 图 灵机 的 第 一 步 是 为 图 灵机 设计 字符 串 的 表示 。 因 为 任意 的 符 符号 编码 
号 都 可 以 在 10,1} 上 的 字符 串 进行 编码 ， 我们 规定 通用 图 灵机 的 输入 字母 表 0 1 
为 10,1| ,而 带 字母 表 为 10,1,B}。 通 用 图 灵机 的 状态 命名 为 | qo ,941,…， A H 
dn} ， 其 中 qo 为 起 始 状态 。 4 a 

标准 图 灵机 可 以 通过 它 的 转换 函数 来 定义 。 标 准 图 灵机 的 转换 格式 为 
8(q,,x) =[qg,y,d]， 这 其 中 q gsQi x,yeT,de {LR}. 我们 使 用 1 的 字 T 
符 串 来 对 M 中 的 元 素 进行 编码 。 假 设 en(z) 代 表 了 符号 z 的 编码 。 那 么 转换 ái pe 
8(q,,x) =[g;,y,d] 就 可 以 用 字符 串 编码 为 : 1 


en(q;)0en( x)0en( q;)0en( y)Oen( d) 
0 用 来 分 离 转换 函数 中 不 同 的 部 分 。 机 器 的 表示 由 经 过 编码 的 不 同 的 转换 函数 组 成 的 。 两 个 连续 的 0 
用 来 分 隔 不 同 的 转换 函数 。 而 表示 的 开始 和 结束 分 别 包含 三 个 0。 
例 11.5.1 ”图 灵机 的 计算 过 程 如 图 
0/0 L 


M G) B/B R O 1/1 R © 


INL 


它 对 于 空 串 和 以 1 开始 的 字符 串 都 能 够 停机 ， 而 对 于 以 0 开始 的 字符 串 则 不 停机 。M 编码 后 的 转 
换 函 数 在 下 面 的 表 中 给 出 。 

那么 我 们 就 可 以 将 M 表示 为 字符 串 

00010111011011101100110101010100110110111011011001110110101101000 口 

可 以 构造 一 个 图 灵机 来 判断 字符 串 xs 10,1] “是否 是 一 ——— MÀ 
个 确定 型 图 灵机 的 表示 。 检 查 的 步骤 首先 判断 是否 包含 了 “5 3) =[¢,.B.R] 101110110111011 


000 作为 前 级 ， 然 后 是 由 00 分 开 的 一 系列 的 有 限 转化 序列 ， 68( 4 ,0) =[ go,0,L] 1101010101 
最 后 以 000 作为 结尾 。 如 果 字 符 串 满足 了 这 些 要 求 ， WAE alg) =[g,1,R] 110110111011011 
就 是 某 个 图 灵机 M 的 表示 。 如 果 状 态 和 输入 符号 的 结合 都 “_5(4.D =[g,1,z] 1110110101101 


是 不 同 的 ， 那么 图 灵机 M 就 是 确定 型 的 。 
接 下 来 ,我 们 来 描述 一 个 三 带 确 定型 通用 图 灵机 U 的 设计 过 程 。U 的 计算 从 带 1 上 的 输入 开始 。 
如 果 输 入 的 字符 串 格式 为 R(M)w， 那 么 就 在 带 3 上 模拟 M 中 执行 输入 为 w 的 计算 过 程 。U 的 计算 包 
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含 了 如 下 的 动作 : 
L 如 果 输 入 的 字符 串 的 格式 不 是 R(M)w， 这 里 M 代表 的 是 确定 型 图 灵机 ，w 为 字符 串 ， IBA U 
将 一 直 向 右 移动 。 
2. 如 果 输 入 的 字符 串 的 格式 是 R(M)w， 则 将 输入 的 字符 串 w 写 人 到 带 3 上 的 开始 位 置 。 然 后 将 
带头 重新 放 在 带 上 最 左边 。 带 3 的 配置 就 是 在 M 上 执行 输入 为 w 的 初始 配置 。 
3. 将 一 个 1 和 状态 qu 的 编码 写 人 到 带 2 Eo 
4. 在 带 3 上 模拟 M 的 转化 ，M 的 转换 是 由 在 带 3 上 的 符号 以 及 在 带 2 上 的 状态 来 决定 的 。 假 设 x 
是 带 3 上 的 符号 ， 而 q; 是 带 2 上 的 状态 的 编码 。 
a) EW 1 寻找 满足 en(q;) 和 en(x) 的 转换 。 如 果 没 有 这 样 的 转换 ， 那么 U 停机 接收 输入 。 
b) 如 果 带 1 上 包含 转换 en( q;)0en(x)0en( gq,)0en(y)0en( qd) 的 编码 ， 那 么 
i) 在 带 2 上 将 en( q;) 替 换 为 en( gq,) 
ii) 将 符号 y 写 和 人 到 带 3 上 
ii) 带 3 上 的 带头 按照 d 声明 的 方向 进行 移动 。 
5. 继续 步骤 4 中 的 计算 ， 从 而 模拟 M 的 下 一 个 转换 。 
定理 11.5.1 语言 Ln = |R(M)w| M 在 输入 w 上 停机 | 是 递归 可 枚 举 的 。 
证 明 : 通用 图 灵机 U 接收 形式 为 RCM) w HWA, XE RM) 是 图 灵机 的 表示 ,而且 M 在 输入 为 
w 时 停机 。 对 于 其 他 的 字符 串 ，U 不 停机 。 因 此 U 的 语言 就 是 Lv。 m 
语言 Ly 通常 被 称 为 停机 问题 的 语言 。 如 果 一 个 字符 串 是 图 灵机 M. 的 表示 和 输入 字符 w 的 结合 ， 
并 且 图 灵机 M 在 输入 w 上 停机 ， 那 么 该 字符 串 就 属于 Lao 
通用 图 灵机 U 的 计算 以 RCM) w 为 输入 ， 并且 模 拟 了 在 M 上 输入 w 的 情形 。 我 们 可 以 通过 设计 
复杂 的 图 灵机 来 模拟 一 个 图 灵机 的 结果 。 当 我 们 说 一 个 图 灵机 M'“ 在 输入 w 的 情况 下 运行 了 M”, I 
么 是 指 M' 接 受 了 R(M) 和 w， 并 且 按 照 通 用 图 灵机 的 方式 模拟 了 M 的 计算 。 
例 11.5.2 对 于 判定 问题 
第 到 次 转化 停机 问题 
输入 : FEX ELM, FER w, Ain 
输出 : 是 ; 如 果 在 M 上 输入 w， 经 过 nn 次 转化 恰好 停机 
否 ， 其 他 情况 。 
其 解决 方法 可 以 通过 模拟 M 的 计算 来 完成 。 直 观感 觉 上 ， 该 解决 方法 应 该 是 “在 输入 w 的 情况 
FZT M”, 并 且 计 算 M 的 转换 次 数 。 
解决 此 问题 的 图 灵机 U' 可 以 在 通用 图 灵机 上 增加 第 四 条 带 来 记录 在 M 的 计算 过 程 中 转换 的 次 数 。 
问题 的 实例 将 以 RM) w0001” 的 字符 串 形式 来 进行 表示 ， 这 里 将 用 单一 进 制 的 n 和 R(M)w 以 三 个 0 
加 以 分 隔 开 来 。 对 于 输入 字符 串 x，U' 的 计算 动作 如 下 : z 
1. 如 果 输 入 的 字符 串 u RÆ 0001"* E, BBA U' 停 机 拒绝 输入 。 
2. 将 字符 串 I 写 人 到 带 4 上 的 起 始 位 置 ， 将 0001”*' 从 带 1 上 的 字符 串 擦 除 ， 并 将 带 4 上 的 带头 
指向 起 始 位 置 。 l 
3. 如 果 带 1 上 的 剩余 的 字符 串 不 具有 ROM) w 的 格式 ， 那 么 U' 停 机 拒绝 输入 。 
4. HFRP w 拷贝 到 带 3 上 ， 并 且 将 q 的 编码 写 人 到 带 2 Eo 
5. 按照 通用 图 灵机 的 策略 ， 在 带 1 寻找 和 带 3 上 的 符号 x 以 及 带 2 上 状态 4 的 编码 匹配 的 转换 。 
a) 如 果 没 有 针对 q 和 x 的 转换 ， 而 且 在 带 4 上 读 入 了 一 个 1， 那 么 U' 停 机 ， 拒 绝 输入 。 
b) 如 果 没 有 针对 q 和 x 的 转换 ， 而 且 在 带 4 上 读 和 人 了 一 个 空格 ,那么 U' 停 机 ， 接 收 输入 。 
c) 如 果 在 带 1 上 有 针对 5( gq;,x) 编码 的 转换 ,并且 在 带 4 上 读 人 了 一 个 空格 ,那么 U' 停 机 ， 
拒绝 输入 。 
d) 如 果 在 带 1 上 有 针对 Sla x) 编码 的 转换 ， 并且 在 带 4 上 读 人 了 一 个 1， 那 么 在 带 2 和 带 3 
上 对 转化 进行 模拟 ， 并且 将 带 4 上 的 带头 向 右 移 动 一 个 单位 。 
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6. 继续 第 S 步 的 计算 ， 并 且 检 查 M 的 下 一 个 转换 。 
如 果 M 在 第 n 次 转换 之 前 就 停机 ， 那么 RCM) w001" 将 会 在 步骤 5(a) 中 被 拒绝 。 在 模拟 了 M 


的 nn 次 转换 之 后 ， 在 带 4 上 的 计数 器 读 和 人 一 个 空格 。 如 果 M 在 这 个 点 上 没有 可 用 的 转换 ， 那 么 U' 
收 输入 ; 否则 ， 输 入 将 会 在 步骤 5(c) 中 被 拒绝 。 T 


11.6 练习 


L 


给 出 能 够 解决 在 11. 1 5 rp E PA Pr Tas A TA PL RR AS, EMERARA In. d,g\ ”的 元 素 ， 这 里 
n, d fll q 分 别 代表 了 五 分 的 硬币 、 十 分 的 硬币 和 二 十 五 分 的 硬币 。 

从 练习 2 到 练习 7， 我 们 描述 了 解决 特定 判定 问题 的 图 灵机 。 在 这 里 使 用 例 11.2.2 作为 定义 图 灵机 
计算 动作 的 模型 。 读 者 不 需要 明确 地 给 出 解决 方案 中 的 转换 函数 或 者 状态 图 。 读 者 可 以 在 解决 方案 中 使 
用 多 带 和 非 确定 型 图 灵机 。 


. 设计 一 个 图 灵机 来 判定 定义 在 10,1| 上 的 字符 串 u 和 v 是 不 是 相等 。 在 计算 开始 之 前 ， 带 上 的 字符 串 为 


BuBvB， 而 且 要 求 在 不 多 于 3( length(U) +1) 次 转换 之 内 完成 判定 。 


3. 使 用 单一 进 制 表示 法 来 描述 自然 数 ， 设 计 一 个 图 灵机 来 判定 一 个 自然 数 是 不 是 素数 。 
4. 使 用 单一 进 制 表示 法 来 描述 自然 数 ， 设 计 一 个 图 灵机 来 判定 “2”” 问 题 。 提 示 : 输入 为 自然 数 i 的 表 


示 ， 而 如 果 对 于 某 个 n， 满 足 i=2”"， 则 输出 “是 ”， 否 则 输出 “ 否 ”。 


. 如 果 一 个 有 向 图 中 包含 至 少 一 个 环 ， 那 么 我 们 把 这 个 图 成 为 有 环 的 。 使 用 11.2 节 中 对 于 有 向 图 的 


表示 方法 ， 设 计 一 个 图 灵机 来 判定 一 个 有 向 图 是 否 是 有 环 的 。 


. 有 向 图 的 遍历 是 指 路 径 po, Pio rs Pn» MAWE: 


i) po =pn; 

ii) 对 于 0 <i,j<n,iAj 意味 着 pp; 

ii) 图 中 的 每 个 节点 都 出 现在 路 径 中 。 

也 就 是 说 ， 一 个 遍历 访问 了 图 中 的 每 个 节点 一 次 且 仅 一 次 ， 并 且 在 起 始点 结束 。 设 计 一 个 图 灵机 判 
定 一 个 有 向 图 中 是 否 包含 了 一 条 遍历 的 路 径 。 要 求 使 用 11.2 节 中 对 于 有 向 图 的 表示 方法 。 


“7. 假设 G=(V,,P,5) 是 正则 文法 。 


a) 在 10,1| 上 为 文法 G 构造 表示 法 。 
b) 设计 一 个 图 灵机 来 判定 字符 串 we “是 否 属于 L(G)。 可 以 使 用 非 确定 型 来 帮助 设计 图 灵机 。 


. 构造 一 个 能 够 将 语言 工 归 约 到 Q 的 图 灵机 。 在 下 面 的 每 个 题目 中 ,LL 使 用 的 字母 表 都 是 |x,y} ， 而 


Q@ 使 用 的 字母 表 都 是 |a,b| o 


a) Lz(x)' Q-(aa)* 
b) =x iy” Q=a*b 
c) Lts y i i0] Q={a'b'|i>0} . 
d) L2 |xyz | i20,20]  Qzlar'|iz0J 
e) L= ix (yy) | i20] Q= {a'b | i20] 
f) L2 |x'yx | iz0| Q = la'p | iz0| 

. 设 M 是 图 灵机 


0/0 R 


M: XT) BER NG) 1/1 R © 0/0 R 


a) 那么 L(M) 是 什么 ? 
b) 利用 11.5 节 中 的 编码 方法 给 出 M 的 表示 。 


10. 构造 一 个 图 灵机 来 判定 利用 10，1} "构造 的 字符 串 是 否 是 一 个 非 确定 型 图 灵机 的 编码 。 如 果 需 要 


判定 输入 是 否 是 一 个 确定 型 图 灵机 的 编码 ， 那 么 该 图 灵机 需要 做 什么 样 的 修改 ? 
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11. 设计 一 个 图 灵机 ， 接 收 在 10,1} 上 的 输入 字符 串 x， 如 果 
i) 对 于 某 个 图 灵机 M 和 输入 字符 串 uu = RCM)w 
i) 当 在 M 上 输入 w， 能 够 有 转换 执行 计算 ， 并 且 输 出 一 个 1。 
图 灵机 不 需要 对 所 有 的 输入 都 停机 。 
12. 给 定 一 个 任意 的 图 灵机 M 和 输入 字符 串 mw， 那么 M 能 否 在 少 于 100 次 的 转换 中 接收 w? 设计 一 个 
图 灵机 来 解决 这 个 判定 问题 。 
13. 证 明 判 定 问 题 
输入 : 图 灵机 M 
输出 : 是 ; 如 果 M 从 空白 带 开 始 计算 ， 它 的 第 三 个 转换 产生 了 一 个 空格 
否 ; 其 他 情况 。 
是 可 以 判定 的 。 如 果 图 灵机 在 第 三 次 转换 之 前 停机 ， 那 么 答案 就 是 否 。 
14. 证 明 下 面 的 判定 问题 
输入 : 图 灵机 M 
输出 : 是 ; 如 果 存 在 we “使 得 M 的 转化 超过 了 10 次 
否 ; 其 他 情况 。 
是 可 判定 的 。 
15. 在 11.5 节 中 引入 的 通用 图 灵机 能 够 模拟 其 他 图 灵机 的 接收 停机 的 动作 。 因 此 ， 表 示 形 式 RCM) 并 
不 包含 对 接收 状态 的 编码 。 
a) 将 对 图 灵机 M 的 表示 RCM) 进行 扩展 ， 使 它 能 够 显示 地 对 M 的 接收 状态 进行 编码 。 
b) 设计 一 个 通用 图 灵机 Ur， 使 得 它 能 够 接收 RCM) w 形式 的 输入 当 且 仅 当 图 灵机 M 在 终结 状态 
接收 了 输入 w. 


参考 文献 注释 


RIR [1936] 设计 了 用 于 理论 计算 的 图 灵机 ， 从 而 能 够 执行 所 有 有 效 的 计算 。 这 个 论点 ， 由 丘 奇 
[1936] 总 结 成 为 丘 奇 一 图 灵 论 题 。 图 灵 在 1936 年 的 论文 中 同样 引入 了 通用 图 灵机 的 设计 。 关 于 存储 
程序 计算 机 的 设计 方案 最 早 由 von Neumann [von Neumann, 1945] 提出 ， 而 第 一 个 工作 模型 在 1949 
年 出 现 。 

在 我 们 设计 的 通用 图 灵机 中 ， 限 制 了 图 灵机 的 输入 和 带 上 可 以 使 用 的 字母 表 分 别 为 {0,1} 和 10,1， 
B| 。 任 意图 灵机 都 可 以 利用 一 个 使 用 上 述 的 字母 表 的 图 灵机 来 模拟 ， 相 关 的 证 明 可 以 参考 Hopcroft 和 
Ullman 的 工作 [1979] 。 


第 12 章 不 可 判定 性 


丘 奇 一 图 灵 论 题 断言 图 灵机 可 以 解决 任何 存在 有 效 解决 过 程 的 判定 问题 。 图 灵机 的 计算 不 会 受到 
“真实 ”计算 设备 所 固有 的 物理 限制 。 因 此 ， 对 于 图 灵机 来 说 ， 问 题 是 否 可 以 解决 取决 于 问题 自身 ， 
而 不 是 取决 于 内 存 和 中 央 处 理 器 可 用 的 时 间 。 丘 奇 一 图 灵 论 题 对 于 不 可 判定 性 也 有 相应 的 结论 。 如 果 
一 个 判定 问题 不 能 够 被 图 灵机 所 解决 ,那么 也 就 不 存在 任何 有 效 的 过 程 能 够 解决 它 。 如 果 一 个 判定 问 
题 不 存在 算法 的 解决 方案 ， 那 么 我 们 就 称 它 为 不 可 判定 的 (Undecidable) 。 

在 9.5 节 中 ,我 们 已 经 证 明了 图 灵机 的 数目 是 可 数 的 。 然 而 ， 在 一 个 非 空 字母 表 上 的 语言 的 数目 
却 是 不 可 数 的 。 这 也 就 意味 着 有 些 语 言 的 成 员 问 题 是 不 可 判定 的 。 这 两 者 数目 的 比较 让 我 们 确信 了 不 
可 判定 问题 的 存在 ， 但 是 却 没有 明确 地 给 出 不 可 判定 问题 的 描述 。 在 本 章 中 ， 我 们 将 给 出 一 些 特定 的 
判定 问题 ， 并 通过 这 些 问 题 来 探讨 图 灵机 计算 能 力 和 相关 文法 的 变种 。 后 面 我 们 可 以 看 到 ， 甚 至 多 米 
诺 游戏 问题 也 是 不 可 判定 的 。 

我 们 考虑 的 第 一 个 问题 是 图 灵机 停机 问题 。 考 虑 到 图 灵机 停机 问题 的 重要 性 ， 我 们 首先 用 C 程序 
而 不 是 用 图 灵机 来 描述 它 。 用 C 程序 描述 的 图 灵机 停机 问题 是 这 样 的 : 

C 程序 的 停机 问题 
输入 : C 程序 Prog， 
针对 Prog 的 输入 文件 input 
输出 : 是 ; 如 果 以 input 为 输入 时 Prog 运行 会 停止 
、 否 ; 其 他 情况 
如 果 对 于 C 程序 的 停机 问题 是 可 判定 的 ， 那么 编程 人 员 所 头疼 的 问题 之 一 一 一 无 限 循环 问题 ， 将 成 为 
过 去 。 程 序 的 执行 将 成 为 一 个 包含 两 步骤 的 过 程 。 

1. 运行 能 够 解决 停机 问题 的 算法 ， 来 判断 Prog 和 input 是 否 停机 。 

2. 如 果 算 法 表明 了 Prog 停机 ， 那 么 利用 input 运行 Prog。 
停机 问题 的 算法 并 不 会 告诉 我 们 程序 实际 运行 的 结果 ， 而 只 是 告诉 我 们 程序 是 否 会 产生 结果 。 在 利用 
停机 问题 得 到 了 肯定 的 回复 之 后 ， 接 下 来 可 以 通过 在 Prog 上 运行 input 来 得 到 结果 。 不 幸 的 是 ，C 程 
序 的 停机 问题 就 像 它 对 应 的 图 灵机 停机 问题 一 样 ， 都 是 不 可 判定 的 。 

在 本 章 的 前 4 节 ， 我 们 会 考虑 输入 字母 表 为 10,1| ， 带 上 的 字母 表 为 10,1,8 的 图 灵机 。 字 母 表 
上 的 限制 并 不 会 对 图 灵机 的 计算 能 力 造 成 影响 ， 这 是 因为 任意 图 灵机 M. 的 计算 都 可 以 利用 使 用 上 面 
字母 表 的 图 灵机 来 模拟 。 模 拟 的 过 程 仅 需要 将 M 上 的 符号 使 用 10,1} 来 进行 编码 。 这 一 点 和 数字 计算 
机 所 采用 的 编码 方法 是 一 致 的 。 数 字 计 算 机 中 一 般 采 用 ASCH, EBCDIC 或 者 Unicode 来 对 字符 进行 
二 进 制 编码 。 


12.1 图 灵机 的 停机 问题 


最 著名 的 不 可 判定 问题 是 和 图 灵机 自身 的 性 质 相关 的 。 接 下 来 我 们 描述 图 灵机 停机 问题 : 给 定 任 
意 的 一 个 图 灵机 M 和 输入 字母 表 王 ， 以 及 字符 串 we L*, 那么 在 M 上 运行 输入 w， 会 不 会 停机 ? 我 
们 接 下 来 将 证 明 没有 算法 能 够 解决 图 灵机 停机 问题 。 图 灵机 停机 问题 的 不 可 判定 性 是 计算 机 科学 理论 
里 面 的 基础 性 结论 之 一 。 

理解 问题 的 描述 是 很 重要 的 。 对 于 一 个 特定 的 图 灵机 ， 我们 可 能 能 够 判定 它 是 否 会 对 任意 给 定 的 
字符 串 停机 。 实 际 上 ， 在 例 8. 3. 1 中 的 图 灵机 仅 对 包含 aa 子 字符 串 的 输入 停机 。 而 图 灵机 停机 问题 的 
解决 方法 则 需要 能 够 对 每 个 可 能 的 图 灵机 和 输入 字符 串 实例 给 出 结论 。 

既然 图 灵机 停机 问题 涉及 到 图 灵机 ， 那 么 它 的 输入 必然 包含 了 一 个 图 灵机 实例 ,或 者 具体 地 说 是 
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一 个 图 灵机 实例 的 表示 。 我 们 将 使 用 在 11.5 节 中 所 设计 的 图 灵机 表示 方法 ， 将 输入 在 10,1| 上 的 图 灵 
机 采用 10,11 进行 编码 。 停 机 问题 的 不 可 判定 性 的 证 明 并 不 依赖 于 特定 编码 的 特征 。 证 明 的 结论 应 该 
对 于 任何 的 图 灵机 编码 表示 都 是 有 效 的 。 在 这 之 前 ,我们 先 将 图 灵机 的 表示 命名 为 R(M) 。 

我 们 将 利用 反 证 法 来 证 明 停 机 问题 的 不 可 判定 性 。 我 们 假设 图 灵机 H 能 够 解决 判定 问题 。 通 过 对 
H 进行 简单 地 修改 我 们 可 以 得 到 另外 一 个 图 灵机 D， 这样 就 会 造成 一 个 矛盾 的 现象 ， 当 图 灵机 D. 使 用 
自己 的 表示 作为 输入 时 候 ， 将 会 出 现 不 可 能 的 情况 。 既 然 假设 存在 能 够 解决 停机 问题 的 HH 会 出 现 矛 
盾 ， 那 么 停机 问题 便 是 不 可 判定 的 。 

定理 12.1.1 图 灵机 的 停机 问题 是 不 可 判定 的 。 

证 明 : 假设 图 灵机 H 能 够 解决 停机 问题 。 那 么 也 能 够 接受 字符 串 ze 10,1}, WR 

i) z 包 含 了 一 个 图 灵机 M 的 表示 ， 并 且 后 面 接着 一 个 字符 串 w; 

ii) M 对 于 以 w 为 输入 的 计算 会 停机 。 . 
如 果 上 述 的 两 个 条 件 有 一 个 不 满足 ， 则 互 拒 绝 接收 输入 。 图 灵机 H 的 操作 情况 如 下 图 所 示 : 


判定 停机 M 对 于 输入 w 停 机 
问题 的 图 接收 
nM 灵机 
拒绝 接收 
M 对 于 输入 w 不 停机 


下 面 我 们 将 H 进行 修改 从 而 得 到 一 个 新 的 图 灵机 H'。H’ 的 计算 和 HH 大 臻 相同， 只 是 当 HH 进 入 接 
收 停机 状态 的 时 候 ，H' 会 继续 计算 。 这 时 候 ，H' 将 一 直 向 右 移 动 。H' 的 转换 函数 是 在 H 的 转换 函数 的 
基础 上 增加 了 ， 当 H 进入 接收 状态 时 ，H' 将 无 限制 的 向 右 移动 。H' 的 行为 通过 下 面 的 图 来 表示 

R(M)w H’ 
循环 
M 对 于 输入 w 不 停机 

在 证 明 中 ， 我 们 只 关心 计算 是 会 停止 还 是 会 不 停 地 继续 。 后 一 种 情况 在 图 中 采用 循环 来 表示 。 

图 灵机 H' 将 和 一 个 负责 复制 的 图 灵机 共同 构造 图 灵机 D。D 的 输入 是 图 灵机 的 表示 RCM) 。D 的 
计算 从 根据 输入 R(M) 来 产生 R(M)R(M) 开 始 。 接 下 来 的 计算 包括 了 在 H' 上 运行 RC(M)R(M)。 
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M 对 于 输入 ROM) SL 







循环 
停机 





M 对 于 输入 RCM) 不 停机 


D 的 输入 可 能 是 建立 在 字母 表 |0,1,B| 上 的 任意 图 灵机 的 表示 。 而 且 ,，D 本 身 也 是 这 样 的 图 灵机 。 
那么 接 下 来 ， 我 们 考虑 使 用 D 来 计算 R(D)。 我 们 将 前 面 图 中 的 M 替换 为 D，R(M) 替换 为 R(D)， 
那么 就 可 以 得 到 : 


D 对 于 输入 R(D) 停 机 循环 
D 对 于 输入 R(D) 不 停机 


观察 这 张 图 ， 我 们 会 发 现 D 在 输入 R(D) 上 停机 ， 当 目 仅 当 D 在 R(D) 上 不 停机 。 这 显然 是 不 可 能 的 。 
然而 , D 是 从 能 够 解决 停机 问题 的 图 灵机 H 直接 构造 得 来 的 。 这 个 假设 直接 造成 了 前 面 的 矛盾 。 因 
此 ， 我 们 总 结 得 出 图 灵机 停机 问题 是 不 可 判定 的 。 am 

在 前 面 的 证 明 中 ， 我 们 使 用 了 自 引用 和 对 角 线 化 。 为 了 得 到 对 角 线 化 证 明 过 程 中 一 个 标准 的 关系 
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表 ， 我 们 可 以 考虑 每 个 代表 图 灵机 的 字符 串 ve [0,1]; WE v RREA RCM) 的 格式 ， 那 么 我 们 将 v 
赋 给 一 个 只 有 一 个 状态 的 而 且 无 转换 的 图 灵机 。 因 此 ， 我 们 可 以 针对 字符 串 入 0, 1, 00, 01, HE 
列 图 灵机 M,, M,, M,, M,, ，M,…。 那 么 我 们 考虑 在 水 平和 垂直 的 轴 上 都 列 出 了 图 灵机 的 一 张 表 。 
表 中 的 第 i, j 个 项 是 

1, 如 果 M, 运行 R(M) 时 停机 

Pen y pran 
表 的 对 角 线 代表 了 自 引 用 问题 的 答案 。“M, 运行 自己 的 表示 会 不 会 停机 ?”。 为 了 说 明 这 个 问题 ,我 们 
构造 D 产生 了 矛盾 的 情况 。 

同样 ， 可 以 对 任意 输 大 字母 表 的 图 灵机 建立 停机 问题 不 可 判定 的 证 明 。 本 方法 的 一 个 根本 特征 是 
它 能 够 利用 自身 的 输入 字母 表 来 将 图 灵机 编码 为 字符 串 。 为 了 构造 这 种 编码 ， 使 用 两 个 符号 就 足 
ET. 

停机 问题 的 不 可 判定 性 和 通用 图 灵机 模拟 图 灵机 计算 的 能 力 结合 在 一 起 ， 证 明了 递归 语言 是 递归 
可 枚 举 语言 的 一 个 真子 集 。 推 论 12. 1. 2 则 是 利用 递归 语言 来 对 停机 问题 的 不 可 判定 性 进行 了 另 一 种 
描述 。 

推论 12.1.2 在 |0,1| 上 的 语言 Ls = |R(M)w|R(M) 图 灵机 M 的 表示 ， 而 M 对 w 停 机 | 不 是 递 
归 语 言 。 

推论 12.1.3 递归 语言 是 递归 可 枚 举 语 言 的 真子 集 。 

WEBB. 通用 图 灵机 U 接收 Lau。 字符 串 能 够 被 U 接收 仅 当 它 的 形式 为 R(M)w， 而 且 在 M 上 运行 
ti A wit, MOL. Ly 能 够 被 图 灵机 U 接收 表明 了 Ly 是 递归 可 枚 举 的 , 但 是 推论 12.1.2 表 明了 Ly 
不 是 递归 的 。 a 

在 练习 8.26 rp, RAIER T iR L AL 都 是 递归 可 枚 举 的 ， 那 么 工 是 递归 的 。 我 们 将 它 和 推论 
12. 1. 2 结合 在 一 起 来 得 到 推论 12. 1. 4。 

推论 12.1.4 语言 Li 不 是 递归 可 枚 举 的 。 

推论 12. 1.4 表明 了 没有 算法 能 够 接收 或 识别 语言 La 中 的 字符 串 。 从 模式 识别 的 角度 来 看 ， 我 们 
可 以 使 用 机 器 来 识别 具有 一 些 共有 模式 的 字符 串 。 当 一 个 语言 不 是 递归 可 枚 举 的 时 候 ， 语 言 成 分 中 任 
何 共 有 的 模式 都 过 于 复杂 ， 以 至 于 无 法 通过 算法 来 发 现 。 


12.2 问题 归 约 和 不 可 判定 性 


我 们 在 第 11 章 中 引入 了 归 约 ， 并 把 它 作为 构造 判 CBE w 入 0 & 件 
定 问题 解决 方法 的 有 力 工具 。 如 果 存 在 一 个 图 灵机 可 P 实例 Pu, pr o 的 答案 是 肯定 的 
计算 的 函数 能 够 将 判定 问题 了 的 实例 转换 为 判定 间 到 47 当 且 仅 当 
题 Q 的 实例 ， 并 且 保持 了 对 于 问题 P 实 例 的 管 案 ; 那 OQ X9. n. PO 的 答案 是 肯定 的 


么 我 们 说 P 可 以 归 约 到 Q。 在 第 11 EP, 我们 使 用 表格 的 形式 来 对 从 P 到 Q 的 归 约 进行 描述 。 归 约 
对 于 不 可 判定 性 的 证 明 同样 有 着 重要 的 作用 。 如 果 了 是 不 可 判定 的 ， 并 且 可 以 归 约 到 Q, 那么 Q 必然 
也 是 不 可 判定 的 。 这 是 因为 如 果 Q 是 可 判定 的 ， 那么 将 从 P 到 Q 的 归 约 过 程 加 上 Q 的 解决 方法 ， 将 
会 产生 了 的 解决 方法 : 对 于 P 的 输入 p, 

i) 使 用 归 约 将 p, 转化 到 r(p)。 

i) 使 用 Q 的 解决 方法 来 判定 r(p;) 的 答案 。 
因为 7 是 一 个 归 约 的 过 程 ， 那么 判定 问题 P 对 于 输入 p, 的 结果 和 Q 对 于 r(pi) 的 结果 是 一 致 的 。 顺 序 
执行 归 约 和 解决 Q 的 算法 能 够 得 到 P 的 解决 方法 。 这 和 已 知 P 是 不 可 判定 的 是 相互 矛盾 的 。 因 此 ， 关 
于 Q 是 可 判定 的 假设 无 法 成 立 。 

空白 带 问题 (blank tape problem) 是 判定 图 灵机 是 否 能 够 在 空白 带 上 开始 计算 并 最 终 停 机 的 问题 。 
空白 带 问 题 是 图 灵机 停机 问题 的 特例 ， 因 为 它 仅 关注 当 输入 为 空 时 的 停机 问题 。 我 们 下 面 将 会 把 图 灵 
机 停机 问题 归 约 到 空白 带 问题 ， 这 样 我 们 就 证 明了 空白 带 问题 是 不 可 判定 的 。 
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定理 12.2.1 没有 算法 能 够 判定 一 个 任意 的 从 空白 带 开始 计算 的 图 灵机 是 否 能 够 停机 。 
TERA: 假设 存在 图 灵机 B 能 够 解决 空白 带 问 题 ,那么 我 们 可 以 将 它 表示 为 


M 对 于 输入 入 停机 










接收 
拒绝 接收 


R(M) 





M 对 于 输入 和 循环 


将 图 灵机 停机 问题 归 约 到 空白 带 问 题 是 由 图 灵机 R 实现 的 。 图 灵机 RR 的 输入 是 图 灵机 M. 的 编码 表示 ， 
接 下 来 是 输入 字符 串 w。R 计算 的 结果 是 图 灵机 M' 的 编码 表示 。 图 灵机 M' 的 动作 为 : 

1. 将 w 写 在 空白 带 上 ， 

2. 将 带头 放 到 初始 位 置 并 将 机 器 的 状态 设 为 M 的 初始 状态 ， 

3. 运行 M。 
R(M') 是 通过 在 R(M) 上 增加 编码 的 转换 ， 并 对 M 的 初始 状态 进行 重 命名 而 得 到 的 。 图 灵机 M' 在 空 
白带 上 运行 停机 当 且 仅 当 在 输入 w 时 候 M 停机 。 

通过 将 图 灵机 R 作为 一 个 预 处 理 器 ， 我 们 可 以 得 到 一 个 新 的 图 灵机 B。 顺 序 地 运行 图 灵机 R 和 B 

366| 可 以 得 到 下 面 图 中 的 图 灵机 。 








M' 对 于 输入 和 停机 
R(M)w 





Marnie ABB 
eM 停机 问题 中- 
追踪 整个 计算 的 过 程 ， 我 们 可 以 看 到 组 合 的 机 器 提供 了 停机 问题 的 解决 方法 。 因为 预 处 理 器 R 可 
以 将 停机 问题 归 约 到 空白 带 问 题 ， 所 以 空白 带 问题 是 不 可 判定 的 。 a 


将 停机 问题 归 约 到 空白 带 问题 的 预 处 理 器 R， 修 改 了 M 的 表示 从 而 构造 了 图 灵机 M“ 的 表示 。 例 
12.2. 1 给 出 了 预 处 理 器 R 执行 转换 的 结果 。 B/B R 

B) 12.2.1 M 是 对 任何 包含 0 的 输入 字符 串 停机 的 图 灵机 。 对 于 M IIR 
的 编码 R (M) 是 


0001011101101110110011011101101110110011011011011011000 M x92 Cy 


输入 RCM)OL, BUAEPESS R Fg TROL M' 的 编码 。 


IIL 
0/0 L M 








[367] 


当 使 用 空白 带 的 时 候 ，M 的 最 初 五 个 状态 用 来 在 输入 位 置 上 写 人 01。M 的 拷贝 接 下 来 在 BOLB 带 上 运 
行 。 从 构造 的 过 程 中 我 们 可 以 看 到 ，M 在 输入 01 时 停机 当 且 仅 当 M' 从 空白 带 开始 运行 停机 。 Li 

因为 空白 带 问题 是 停机 问题 的 子 问 题 ,那么 接 下 来 我 们 考虑 问题 、 子 问题 和 不 可 判定 性 之 间 的 关 
系 。 下 面 的 问题 都 是 对 停机 问题 的 输入 进行 限定 而 得 的 。 
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子 问题 输 入 可 A x 
空白 带 问 题 R (M), (AAEE) 不 可 判定 
通用 图 灵机 停机 问题 U (机 器 固定 ), R (M) w 不 可 判定 
例 8.3.1 的 M 停机 问题 《机 融 固定 ) w 可 判定 


对 于 通用 图 灵机 停机 问题 是 判定 对 于 输入 R(M)w， 通 用 图 灵机 U 是 否 会 停机 。 这 个 问题 的 解决 
方法 将 可 以 用 来 判定 任意 的 图 灵机 M 对 于 输入 w 是 否 会 停机 ， 这 样 就 可 以 得 到 图 灵机 停机 问题 的 解 
决 方法 。 从 前 面 的 表 中 我 们 可 以 看 出 : 一 个 不 可 判定 问题 的 子 问题 是 否 是 可 判定 的 ， 取 决 于 子 问题 对 
于 问题 特征 的 保留 程度 。 另 一 方面 ， 如 果 Q 是 P 的 子 问题 ,并 且 Q 是 不 可 判定 的 ， 那么 P 必然 是 不 可 
判定 的 。 这 是 因为 任何 能 够 解决 问题 P 的 算法 都 可 以 解决 它 的 子 问题 。 

将 停机 问题 归 约 到 空白 带 问题 是 由 图 灵 可 计算 函数 > 完成 的 ，r 将 RCM) w 转换 为 R(M')。 定 理 
12. 2. 1 和 例 12. 2. 1 表明 了 如 何 将 图 灵机 的 表示 RCM) 修改 为 RCM') 。 在 接 下 来 的 例子 中 ,我 们 将 对 
归 约 给 出 一 个 较 高 层次 的 解释 ， 并 省 略 掉 字 符 串 表示 的 操作 细节 。 


12.3 其 他 的 停机 问题 


我 们 已 经 证 明了 图 灵机 停机 问题 和 空白 带 问题 都 是 不 可 判定 的 。 对 于 图 灵机 ， 我 们 还 有 很 多 其 他 
的 问题 ,“ 计 算 过 程 中 图 灵机 是 否 会 进入 一 个 特定 的 状态 ”， 或 者 “计算 是 否 会 在 它 的 终结 状态 上 写 下 
一 个 特定 的 符号 ”等 等 。 利 用 图 灵机 停机 问题 的 不 可 判定 性 ， 我 们 可 以 对 很 多 这 样 的 问题 进行 归 约 ， 
从 而 得 出 这 些 问 题 也 是 不 可 判定 的 。 

下 面 ， 我 们 将 利用 图 灵机 计算 初始 状态 重信 的 问题 来 展示 证 明 此 类 问题 不 可 判定 性 的 大 致 策略 。 
初始 状态 重信 的 计算 满足 goBwB F ugovB。 计 算 不 需要 在 终结 状态 停机 或 者 根本 不 需要 停机 ， 所 需要 
的 只 是 机 咒 在 计算 开始 后 的 某 个 点 能 够 返回 它 的 初始 状态 qo。 

我 们 通过 将 图 灵机 停机 问题 归 约 到 初始 状态 重信 问题 来 证 明 它 是 不 可 判定 的 。 归 约 的 形式 正如 表 
中 所 示 ， 对 于 图 灵机 停机 问题 中 的 M 和 初始 状态 重 人 问题 中 的 M'， 我 们 将 使 用 相同 的 字符 串 wo 





子 问 题 输 入 可 A E 
空白 带 问题 图 灵机 M， 字 符 串 w M 在 w 下 停机 
到 l 当 且 仅 当 
重 入 问题 图 灵机 M'， 字 符 串 w M 运行 w 时 进入 了 初始 状态 


设 M=(Q, 二 ,T,5,q,E)， 而 ww 是 图 灵机 停机 问题 实例 中 的 输入 字符 串 。 我 们 需要 构造 一 个 图 灵 
机 M'， 使 得 M "满足 : 当 输 入 为 w 时 ，M' 重 新 进入 初始 状态 当 且 仅 当 图 灵机 M 在 输入 w 时 会 停机 。 
首先 需要 注意 到 , 在 任意 一 个 图 灵机 中 ， 我 们 无 法 直观 地 将 图 灵机 停机 问题 和 初始 状态 重 人 问题 联系 
在 一 起 。 在 归 约 过 程 的 设计 中 ,我 们 需要 将 两 者 联系 起 来 。 
构造 M' 的 思路 是 ， 从 M 开始 ， 增 加 一 个 具有 和 qu 具有 相同 转换 函数 的 状态 qs， 并 上 且 为 % 增 加 向 
M 中 所 有 停机 状态 的 转换 。 如 果 形 式 化 地 定义 ，M' 是 根据 M 的 成 分 来 定义 的 : 
Q'=(QUiggt!), 2’ =2F=0),F sF 
8'(q;,x) =6( qi 5X) ,如 果 6( qi X) 已 经 定义 
8'(qy,x) =6(gqo ,xX) ,对 于 所 有 的 xeT 
8'(q,,x) 2 [qo x, R] ,如果 6(gq,,x) 没 有 被 定义 
M 的 初始 状态 为 gs。 如 果 在 M 上 运行 输入 w 停机， 那么 相应 地 ，M' 就 可 以 再 多 执行 一 步 计 算 从 而 进 
入 qoo WR M 上 运行 输入 w 不 停机 ， 那么 在 M' 上 就 不 会 执行 进入 qs 的 转换 ， 从 而 不 会 回 到 初始 状 
So RF, 我们 就 把 在 M 上 运行 输入 w 是 否 停机 的 问题 转换 为 M' 是 否 会 重新 进入 初始 状态 的 问题 。 
因此 ,我 们 便 可 以 得 出 初始 状态 重 人 问题 也 是 不 可 判定 的 。 
例 12.3.1 我 们 使 用 反 证 法 证 明了 判定 对 图 灵机 输入 任意 的 字符 串 是 否 会 停机 是 不 可 判定 的 。 假 
设 有 图 灵机 A 可 以 解决 这 样 一 个 问题 : 对 于 输入 的 字符 串 ve [0,1] ^, ， 如 果 输 入 满足 某 个 图 灵机 M 
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的 编码 ， 即 v=R(M); mE M 对 所 有 的 输入 都 停机 ; 则 图 灵机 A 接收 输入 。 如 果 输 入 不 能 代表 一 个 
图 灵机 ， 或 者 输入 所 代表 的 图 灵机 对 于 某 些 输入 不 能 停机 ， 那 么 A 就 拒绝 输入 。 
图 灵机 A 的 计算 步骤 如 下 图 所 示 : 


M 对 于 所 有 字符 串 停 机 接收 
R(M) A 其 他 
拒绝 接收 


下 面 ， 我 们 将 利用 归 约 技术 来 从 图 灵机 A 得 到 图 灵机 停机 问题 的 解决 方法 。 这 样 就 意味 着 “对 所 有 字 
符 串 停机 ”问题 是 不 可 判定 的 。 

停机 问题 对 应 的 语言 包含 了 RCM) w 形式 的 字符 串 ， 这 里 M 代表 了 某 个 图 灵机 ， 而 且 在 M EZ 
行 w 能 够 停机 。 在 这 里 ， 我 们 通过 构造 图 灵机 了 来 完成 归 约 的 步骤 。 归 约 的 第 一 步 是 判定 输入 的 字符 
串 是 否 为 图 灵机 的 表示 及 输入 字符 串 的 结合 。 如 果 输 入 不 具有 这 样 的 格式 ， 那 么 RR 擦 除 输 入 ， 并 保留 
空白 带 。 

当 输 入 的 字符 串 为 R(M)w 时 ，R 的 计算 构造 了 这 样 一 个 图 灵机 M' 的 编码 ，M' 对 于 输入 字符 
EB ye 

1. 从 带 上 擦 除 y, 

2. 将 w 写 人 到 带 上 ， 

3. 在 M 运行 w。 
R(M') 是 通过 在 R(M) 基 础 上 增加 两 组 转换 规则 而 得 的 : 一 组 转换 擦 除 原本 在 带 上 的 输入 ， 另 外 一 
组 转换 在 输入 的 位 置 写 人 w。M' 是 完全 忽略 它 的 输入 的 。M' 的 计算 停机 当 且 仅 当 在 M 上 运行 w 
停机 。 

将 图 灵机 R 和 A 结合 在 一 起 的 图 灵机 如 下 图 所 示 : 






M 对 于 w 停 机 





接收 


RIW 拒绝 接收 


UL dc 保山 问题 一 一 一 一 一代 


这 样 就 得 到 了 图 灵机 停机 问题 的 解决 方法 。 如 果 输 入 不 具有 RCM) w 的 格式 ， 那 么 利用 R 来 产生 空 字 
符 串 ， 并 由 A 来 拒绝 。 否 则 的 话 ， 由 R 来 产生 R(M')。 追 踪 图 灵机 的 操作 序列 ， 我 们 可 以 知道 输入 
被 接收 当 且 仅 当 它 是 图 灵机 M 和 输入 字符 串 w 的 表示 ， 而 且 在 运行 w 的 时 候 ，M 会 停机 。 

因为 图 灵机 停机 问题 是 不 可 判定 的 ， 而 且 在 R 上 执行 归 约 是 可 行 的 ， 所 以 我 们 可 以 总 结 得 出 没有 
图 灵机 能 够 解决 “对 所 有 字符 串 停机 ”的 问题 。 口 

在 10. 1 节 中 ,我 们 已 经 在 图 灵机 和 非 限定 文法 之 间 建 立 起 来 了 对 应 关系 。 这 种 关系 可 以 用 来 将 
非 限定 的 结果 从 自动 机 的 领域 中 转换 到 文法 的 领域 中 。 通 过 考察 非 限定 文法 G 是 否 能 够 产生 字符 串 
w， 我 们 便 可 以 借助 于 归 约 技术 来 给 出 问题 的 不 可 判定 性 。 








H 8 输 入 条 件 
停机 问题 图 灵机 M， 字 符 串 w M 运行 w 停机 
到 i 4AM 
推导 性 问题 非 限 定 文法 G; 字符 串 w G 中 存在 推导 S Sw 


设 M 为 图 灵机 ， 而 w 为 输入 字符 串 。 归 约 的 第 一 步 是 对 M 进行 修改 ， 从 而 得 到 另外 一 个 图 灵机 M", 
M “能够 接收 能 使 M 停机 的 每 个 字符 串 。 为 了 做 到 这 一 点 ， 我 们 可 以 将 M 中 所 有 的 状态 都 设 为 M' 的 接 
收 状 态 。 在 M' 中 ， 停 机 和 接收 是 同样 的 含义 。 
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利用 定理 10. 1.3 ， 我 们 可 以 构造 文法 Gw ， 使 它 满足 L(Gw ) =L(M')。 判 定 是 否 wsL(CGw') 的 
算法 同样 可 以 判定 M 和 M' 的 计算 是 否 停机 。 因 此 ， 这 样 的 算法 是 不 可 能 存在 的 。 


12.4 REEE 


在 前 面 的 章节 里 面 ， 我 们 已 经 证 明了 对 于 任意 图 灵机 的 某 些 特定 计算 问题 ， 是 不 可 能 构造 算法 来 
进行 回答 的 。 第 一 个 例子 就 是 图 灵机 停机 问题 ， 即 “图 灵机 M 上 运行 w 是 否 会 停机 ?”。 通 过 问题 归 
约 技术 ， 我 们 可 以 知道 同样 没有 算法 能 够 回答 “从 空白 带 开始 ， 图 灵机 M 是 否 会 停机 ?” 在 这 些 判定 
问题 中 ， 输 入 包含 了 一 个 图 灵机 ， 而 我 们 所 关心 的 是 图 灵机 计算 的 结果 。 

现在 我 们 不 再 考虑 图 灵机 对 于 特定 输入 字符 串 的 计算 ,而 是 集中 考察 图 灵机 所 接收 的 语言 是 否 满 
足 一 个 预先 确定 的 属性 。 例 如 ， 我 们 可 能 比较 关心 如 下 的 这 类 算法 是 否 存在 : 给 定 一 个 图 灵机 M E 
为 输入 ， 能 否 产 生 如 下 间 题 的 解 : 

i) MeL(M)? 

ii) L(M) =Ø? 

ii) L(M) 是 正则 语言 ? 

iv) L(M) 227? 

通过 使 用 在 (0, 1] 上 的 字符 串 对 图 灵机 进行 编码 ， 我 们 可 以 将 前 面 提 到 的 问题 转换 为 语言 的 成 
员 资 格 问题 。 利 用 编码 技术 ， 能 够 定义 在 10,11 上 语言 的 一 组 图 灵机 和 判断 图 灵机 M 接收 的 语言 是 否 
满足 一 个 性 质 的 问题 ， 便 可 以 被 视 为 特定 语言 RCM) 的 成 员 问 题 。 例 如 ，L(M) = 乡 这 个 问题 可 以 表 
示 为 语言 成 员 问题 R(M) e Lg。 使 用 这 种 方法 ,前 面 的 问题 可 以 转换 为 : 

i) L,={R(M) heLCM) |, 

ii) Le - IRCM) | L(M) =Ø}, 

iii) Les = RCM) | L(M) 是 正则 的 | , 

iv) Ly 2 IR(M) | LO) 2 ZI. 
fA) 12.3.1 RIIT Ly 的 成 员 问题 是 不 可 判定 的 。 即 ， 没 有 算法 能 够 判定 图 灵机 是 否 对 所 有 的 输入 字符 
串 都 能 停机 。 

例 12.3. 1 中 使 用 的 归 约 策略 可 以 被 泛 化 ， 进 而 可 以 证 明 很 多 图 灵机 表示 的 语言 都 不 是 递归 的 。 
递归 可 枚 举 语言 的 一 个 性 质 P 描述 了 递归 可 枚 举 语言 可 能 满足 的 条 件 。 例 如 , P 可 能 是 “语言 包含 了 
空 串 ”,“ 语 言 是 空 集 ",“ 语 言 是 正则 的 ”或 者 “语言 包含 了 所 有 的 字符 串 ”。 语 言 的 性 质 了 被 定义 为 
Lp -|R(M) | L(M) 满 足 P |o AIE, Lo 描述 了 所 有 具有 “语言 是 空 集 ”性 质 的 语言 的 图 灵机 表示 ， 
这 些 图 灵机 不 接收 任何 输入 字符 串 。 

如 果 没 有 递归 可 枚 举 的 语言 满足 性 质 P ， 或 者 所 有 的 递归 可 枚 举 语言 均 满足 性 质 P ， 那 么 我 们 将 
递归 可 枚 举 语言 的 性 质 P 称 为 无 价值 的 《trivial) 。 对 于 每 个 无 价值 的 性 质 ，Ls 要 么 是 空 集 要 么 包含 了 
所 有 图 灵机 的 表示 。 这 些 无 价值 性 质 的 语言 成 员 资格 都 是 可 判定 的 。 莱 斯 定理 (Rice's Theorem) 证 
明了 对 于 部 分 递归 可 枚 举 语言 满足 的 性 质 ， 它 的 成 员 资格 却 是 不 可 判定 的 。 

定理 12.4.1 ( 莱 斯 定理 ) PRP 是 递归 可 枚 举 语 言 的 非 无 价值 性 质 ， 那 么 Le 不 是 递归 的 。 

WEBB. 设 P 是 递归 可 枚 举 语言 的 非 无 价值 性 质 。 我 们 将 要 证 明 Le = (RCM) | L(M) 满 足 P| 不 是 
递归 的 。 

因为 L, 是 非 无 价值 的 。 那 么 至 少 有 一 个 语言 LeL。。 而 且 ， 根据 空 语言 不 满足 P 的 假设 ,我 们 
可 以 知道 L 不 为 空 。 这 里 使 用 M, 来 表示 接收 工 的 图 灵机 。 

我 们 通过 将 停机 问题 归 约 到 Le 来 证 明 Le 不 是 递归 的 。 如 同 在 例 12. 3. 1 中 一 样 ， 用 于 预 处理 的 图 
灵机 R 被 用 来 完成 从 输入 RCM) 到 图 灵机 M' 的 转换 。 那 么 当 输入 y 的 时 候 ，M 的 动作 为 

1. 将 w 写 入 到 y 的 右边 ,产生 ByBwB; 

，2. 在 M 上 运行 w; 
3. WRM 运行 w 停机 ， 那 么 在 M, 上 运行 y。 
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在 这 里 图 灵机 M 和 字符 串 w 扮演 的 是 看 门人 的 角色 。 只 有 当 在 M 上 运行 w 停机 时 才 人 允许 使 用 M, 来 
处 理 y 。 

如 果 M 在 运行 w 时 会 停机 ， 那 么 允许 使 用 M, 来 处 理 y。 在 这 种 情况 下 ，M' 对 于 输入 y 的 计算 动作 
和 M, 处 理 y 的 动作 是 一 样 的 。 因此, LCM’) =L(M,) =L ii L(M’) EP 。 如 果 M 对 于 w 的 计算 并 
不 停机 ， 那么 M' 对 于 任何 输入 均 不 停机 。 因 此 ，M' 不 接收 任何 输入 ， 即 L(M') = 人 ,这样 便 不 满足 P 。 

当 M 对 于 输入 w 不 停机 时 ，M' 接 收 O. 4 M 对 于 输入 w 停机 时 ， M' 接 收 L, ~o BESA L 满足 P 而 
多 不 满足 P ， 那 么 L(M') 满 足 P 当 目 仅 当 M 对 于 输入 w 停机 。 

现在 假设 L, 是 递归 的 。 那 么 必然 存在 图 灵机 M, 可 以 判定 工 , 的 成 员 资 格 。 将 R 和 Ms 结合 在 一 
起 ， 我 们 就 可 以 构造 出 停机 问题 的 解决 方法 。 






M 对 w 停 机 接收 


sates 拒绝 接收 


因此 ， 性 质 P 是 不 可 判定 的 。 

我 们 最 初 假设 空 集 是 不 满足 P 的 。 如 果 弛 EL , 那么 我 们 便 可 以 用 前 面 的 证 明 来 表明 不 是 递归 
的 。 这 和 练习 8. 26 中 L, 必须 是 非 递归 的 结论 是 一 致 的 。 m" 

EB FIERE, 我 们 可 以 很 容易 地 利用 图 灵机 接收 语言 的 性 质 来 证 明 问题 的 不 可 判定 性 。 我 们 
将 在 下 面 的 例子 中 来 展示 这 一 点 。 

例 12.4.1 “判定 一 个 被 图 灵机 接收 的 语言 是 否 为 上 下 文 无 关 的 ”是 不 可 判定 的 。 根据 莱 斯 定 
理 ， 我 们 需要 做 的 工作 就 是 证 明 “ 上 下 文 无 关 ” 这 个 性 质 不 是 递归 可 枚 举 语言 的 非 无 价值 性 质 。 我 们 
可 以 通过 找到 两 个 递归 可 枚 举 的 语言 ， 一 个 是 上 下 文 无 关 的 、 为 一 个 不 是 来 完成 证 明 。 语 言 8 和 
la'b'c | i=0| 都 是 递归 可 枚 举 的 。 前 者 是 上 下 文 无 关 的 ， 而 后 者 却 不 是 。 口 


12.5 不 可 解决 的 词 问题 


半 图 厄 (semi-thue) 系统 是 根据 它 的 开发 人 员 ， 挪 威 数学 家 阿 力克 斯 .图 厄 (Alex Thue) 来 命名 
的 。 这 个 系统 包含 了 一 个 字母 表 忆 和 一 组 规则 组 成 的 集合 P。 规 则 包括 了 orw， 这 里 we X^ me'i 
这 个 系统 并 没有 区 分 变量 和 终结 符 ， 也 没有 指定 的 开始 符号 。 半 图 厄 系统 上 的 词 问题 是 判定 对 于 任意 的 
半 图 厄 系统 S-CX,P)REBuveX' ,是否 可 以 在 S 中 从 uw 推导 出 v。 我 们 将 要 证 明 可 以 将 停机 问 
题 归 约 到 词 问题 。 归 约 是 通过 在 图 录 机 计算 和 半 图 厄 系统 中 的 推导 之 间 建 立 联系 来 实现 的 。 

设 M=(Q, ,TT,6,qo,F) 是 确定 型 图 灵机 。 使 用 定理 10. 1.3 中 对 于 构造 过 程 的 修改 ,我们 可 以 构 
造 一 个 模拟 M 计算 过 程 的 半 图 厄 系 统 Sw = ( Zw,Pw)。Sw 的 字母 表 是 集合 QUTU |[ ,] LIU MM 
Su 中 的 规则 结合 Py 定义 为 : 

1. qxy—zq;y, 4 6(q,,x) =[9,,z,R]MA y eT 

2. qx] z4,B] , *46(q,,x) =[4,,z,R] 

3. yqx4;,yz, 4 8lq x) =[4,,z,L] MA y eT 

4.qux—q«, WR 6( gq;,x) 有 定义 

5. dpX—qn, HF xer 

6. gg] 一 gz] 

7. xqq >q, XT xer 

8. [a >l q; 

在 定理 10. 1.3 中 用 来 生成 [goBw] 的 规则 在 这 里 被 省 略 了 ， 这 是 因为 半 图 厄 系 统 关注 的 是 能 否 
从 字符 串 二 推导 出 另 一 个 字符 串 "， 而 不 涉及 特定 的 初始 配置 。 擦 除 规则 (从 5 到 8) 经 过 修改 ， 当 
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M 对 于 输入 w 停 机 的 时 候 ， 它 们 可 以 产生 字符 串 [qj] 。 

在 Sw 上 模拟 M 的 计算 需要 操作 形 如 [ uqv ] JETER, 这 里 u,veT* ,ge QU1g/,qr,94.1。 引 理 
12.5. 1 列 出 了 用 于 模拟 M 计算 的 Sv 中 推导 步骤 的 一 些 重要 属性 。 

引 理 12.5.1 假设 M 是 确定 型 图 灵机 ，S ZAM 构造 的 半 图 厄 系统 。w = [uqv], iE € uve 
T" ,并且 :ge QUl|g,qr,4i|。 

i) 至 多 有 一 个 字符 串 LA WZ. 

ii) 如果 存 在 这 样 的 z， 那 么 z 也 有 [uw'q'v'] 的 形式 ,这 里 w ,vy'eT" ,并 且 qeQUIda q,,.d.l 

WEBB: 使 用 规则 可 以 将 QU | gj, qx ,941 中 元 素 的 一 个 实例 替换 为 男 一 个 。M 的 确定 性 保证 了 当 
qeQit, 在 Pu 中 至 多 有 一 个 规则 可 以 适用 于 [ ugqv]。 如 果 4 = gg， 那 么 仅 有 一 个 规则 可 以 适用 于 
[ugqrv]。 规 则 是 由 字符 串 v] 中 的 第 一 个 符号 确定 的 。 类 似 地 ， 也 只 有 一 条 规则 适用 于 [ug, ]。 最 后 ， 
对 于 包含 q 的 字符 串 ， 在 Pv 中 没有 适用 的 规则 。 条 件 ii) 则 可 以 直接 从 Py 中 的 规则 得 到 。 " 

通过 在 M 上 输入 w 并 停机 的 计算 可 以 得 到 一 个 推导 

[aoBwB] 避 [ugay] 

擦 除 规则 将 这 个 字符 串 转 化 为 [qj] 。 这 些 性 质 合 在 一 起 就 产生 了 定理 12. 5.2。 

定理 12.5.2 确定 型 图 灵机 M 对 于 输入 w 停 机 当 且 仅 当 [ goBwB] 忆 [qi]。 
图 灵机 计算 与 相应 的 半 图 厄 系统 中 推导 之 间 的 关系 将 利用 下 面 的 例子 来 解释 。 

例 12.5.1 图 灵机 


0/0 R 


M: O B/B R A 1/1 R 


接收 的 语言 是 0"1(0U1) ”。 相 应 的 半 图 厄 系统 的 规则 是 


qo, BB—Bq,B q,0B—0q,B q,1B—1q;B 
q, B0—Bq,O q,00—0q,0 ~ q,10—1q;0 
qyBI —Bq,1 q,01—048,1 qi11—14q,l 


qoB ] ^Bq,B] q,0]—04, B) q,1]—14,B] 


q,0—4, qrB—qr Bq,—4, 
qol qr GR0 一 'GR 04,4, 
q,B—4, qrl ds 14,4, 
q;B—4, qr]—qi] [Lala 
q,0—4; 

q,1—4, 

M 接收 011 的 计算 对 应 于 半 图 厄 系 统 Sy 中 从 [qoB0118] 到 [ qj] 的 推导 。 
q,B011B [q,B0H B] 


+ Bq,011B „=| Bq,011B] 

FB0g11B =[B0q,11B] 

+ B01q4,]B — —[B0Iq,1B] 
—[B01q,B] 
—[B01q,] 
=| B014, | 
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=> [ BOq, | 
=>[ Bq, | 
=[4,] 
=[ 9] H 
ALFA FS JE. RSP HE PA LPH RE 71, RATE BH KEEA BEH R H 
定性 提供 了 基础 。 
定理 12.5.3 半 图 厄 系统 中 的 词 问题 是 不 可 判定 的 。 
TEAR: 前 面 的 定理 已 经 给 出 了 从 停机 问题 到 词 问题 的 归 约 过 程 。 对 于 一 个 图 灵机 M 和 它 相应 的 
半 图 厄 系统 Sw， 图 灵机 M 针对 w 的 计算 停机 等 同 于 可 以 在 Sw 中 从 [qoBwB] 推 导 到 [ g,] 。 PARE 
的 算法 同样 可 以 用 来 解决 图 灵机 停机 问题 。 
根据 定理 12. 5. 3， 我 们 知道 对 于 任意 的 半 图 厄 系 统 S = ( 工 ,P) 和 Y* 中 的 一 对 字符 串 ， eR 
能 够 解决 词 问题 。 利 用 我 们 在 定理 12. 5.2 中 建立 的 图 灵机 M 计算 与 Sw 系统 中 推导 之 间 的 关系 ， 同 样 
可 以 证 明 在 特定 的 半 图 厄 系统 中 ， 词 问题 也 是 不 可 判定 的 。 
定理 12.5.4 ik M 为 接收 非 递归 语言 的 确定 型 图 灵机 。 那 么 在 半 图 厄 系 统 Sm 中 ， 词 问题 是 不 可 
判定 的 。 
证 明 : 因为 M 识别 的 是 非 递归 语言 ， 所 以 对 于 M 来 说 ,停机 问题 是 不 可 判定 的 (练习 3)。M 的 
计算 与 Sv 的 推导 之 间 的 对 应 关系 表明 了 在 这 个 系统 中 词 问题 是 不 可 判定 的 。 Ld 


12.0 ”波斯 特 对 应 问 是 


在 前 面 的 章节 中 引入 的 不 可 判定 问题 与 图 灵机 的 性 质 或 者 与 模拟 图 灵机 的 数学 系统 [Taba 
有 关联 。 波 斯 特 对 应 问题 是 一 个 复合 的 问题 ; 它 可 以 被 描述 为 操作 多 米 诺 骨 牌 的 游戏 。 
一 个 多 米 诺 骨牌 包含 了 从 固定 字母 表 得 出 的 两 个 非 空 字符 串 ， 一 个 在 多 米 诺 骨牌 的 上 半 部 分 ， 另 一 个 
在 下 半 部 分 。 

波斯 特 对 应 系统 可 以 被 视 为 定义 了 一 个 有 限 类 型 的 多 米 诺 骨 牌 的 集合 。 

游戏 从 放 在 桌子 上 的 一 个 多 米 诺 骨牌 开始 。 接 着 在 它 的 右边 再 安放 另外 一 个 多 米 诺 骨牌 EA 
这 个 过 程 ， 从 而 产生 一 系列 彼此 相 邻近 的 多 米 诺 骨牌 。 这 里 我 们 假设 每 种 多 米 诺 骨 牌 的 数目 是 无 
穷 的 。 

将 一 系列 多 米 诺 骨 牌 的 上 半 部 分 连接 在 一 起 就 可 以 得 到 字符 串 。 我 们 把 它 称 为 顶部 字符 串 。 类 似 
地 可 以 定义 底部 字符 串 。 游 戏 的 目的 是 要 找到 一 个 序列 ， 从 而 能 够 产生 同样 的 顶部 字符 串 和 底部 字符 
串 。 考 虑 波斯 特 对 应 系统 中 有 下 列 的 多 米 诺 骨 牌 


| ba j| a |e | 
下 面 的 序列 能 够 产生 acbaaach 这 样 等 同 的 顶部 和 底部 字符 串 
|a | c | ba | a J ach | 
[ac | ba | a | ac | 5 | 
严格 地 说 ， 波 斯 特 对 应 系统 (post correspondence system) 包含 了 字母 表 并 和 有 限 的 有 序 对 d; 
v] Be, HH i=1, 2,3, ...., n, u, ve 5*。 波 斯 特 对 应 系统 的 解决 方法 是 一 个 序列 iy, 
i, ttt yi, AAFAA E 
u; Yi, jus. =v; Yi, "Ms. 
判定 波斯 特 对 应 E RAIA ELE Dy HEISE CS QNA 应 问题 。 


9112.6.1 拥有 字母 表 上 | a,b} 和 有 序 对 [aaa,aa] [baa,abaaa] 的 波斯 特 对 应 系统 ， 具 有 如 下 的 
解决 方法 。 
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| aaa | baa | aaa | 
| aa |abaaa| aa | n 


例 12.6.2 对 于 具有 字母 表 [ a,b] 和 有 序 对 [ ab,aba] [bba,aa] [aba,bab] 的 波斯 特 对 应 系统 来 
说 ， 如 果 解 决 方法 存在 的 话 ， 必 然 是 以 下 面 的 多 米 诺 开始 


E 
| aba | 
因为 这 个 是 惟一 的 顶部 和 底部 前 组 一 致 的 多 米 诺 骨 牌 。 顶 部 的 字符 串 接 下 来 必须 以 & 开始 。 有 两 种 可 能 : 
BRETT 
[abs | aba | | aba | bab | 
(a) (b) 


ER (a) 中 的 第 四 个 字符 不 再 匹配 。 那 么 构造 解决 方法 的 惟一 途径 就 是 对 图 (b) 进行 扩展 。 同 样 的 原因 ， 我 们 看 到 在 
顶部 字符 串 中 下 一 个 要 出 现 的 元 素 必须 是 b。 因 此 ， 就 会 产生 


| ab | aba | bba | 

[aba | bab | aa | 
但 是 ， 因 为 顶部 和 底部 的 第 七 个 字符 不 相同 ， 所 以 不 可 能 构造 一 个 解决 方法 。 我 们 已 经 表明 了 没有 办 
法 能 够 构造 出 顶部 和 底部 相同 的 字符 串 。 因 此 ， 这 个 波斯 特 对 应 系统 并 不 存在 解决 方法 。 m 


通过 在 半 图 厄 系统 中 利用 推导 来 模拟 多 米 诺 骨牌 的 序列 ， 我 们 可 以 证 明 波斯 特 对 应 问题 是 不 可 判 
定 的 。 根 据 定理 12. 5.4， 我们 已 经 知道 半 图 厄 系统 S=( >,P) 的 词 问题 是 不 可 判定 的 。 即 ， 没 有 算法 


能 够 判定 是 否 可 以 通过 使 用 规则 P， 从 字符 串 4 推导 出 字符 串 v。 相 应 的 归 约 如 下 


H 8 输 入 条 ç A 
S=(2,P) PRT HES HE FFE u,v 从 4 可 以 推导 出 v 
到 l 当 且 仅 当 
波斯 特 对 应 系统 多 米 诺 骨牌 集合 Cuv 波斯 特 对 应 系统 C, ,存在 解决 方法 


归 约 过 程 包含 根据 规则 P 和 字符 串 w 和 v 来 在 半 图 厄 系统 中 进行 推导 ， 从 而 产生 多 米 诺 骨 牌 。 

定理 12.6.1 没有 算法 能 够 判定 任意 的 一 个 波斯 特 对 应 系统 是 否 存 在 解决 方法 。 

WEBB: 我 们 用 S =( ,P) 来 表示 定义 在 {0,1| 上 ， 而 且 词 问题 是 不 可 判定 的 半 图 厄 系统 。 对 于 字 
RB u, ve "我 们 可 以 构造 相应 的 波斯 特 对 应 系统 C;,,，Cis 有 解决 方法 当 且 仅 当 4 zov. AG 
面 的 这 个 问题 是 不 可 判定 的 ， 所 以 就 没有 通用 的 算法 能 够 解决 波斯 特 对 应 问题 

我 们 首先 在 S 的 产生 式 集合 中 加 入 规则 00 .和 1 一 1。 在 加 入 规则 后 的 系统 中 ,大 部 分 推导 都 和 8$ 
相同 ， 只 是 增加 了 不 对 字符 串 进行 转换 的 规则 。 然 而 ， 使 用 这 种 规则 可 以 保证 当 4 v 时 ; u 可 以 经 
过 等 长 度 的 推导 得 出 v。 为 了 避免 符号 混用 ,这 里 我 们 继续 使 用 符号 S 来 表示 加 入 规则 后 的 系统 。 

假设 uw 和 v 是 10,1} 上 的 字符 串 。 波 斯 特 对 应 系统 C, ,由 u,v 和 S 构造 得 到 。C, ,的 字母 表 包 含 
了 0、0、1、1、[、]、* 和 *。 全 部 由 包含 上 标的 字符 组 成 的 字符 串 w， 可 以 被 表示 为 w。 

S (包含 了 020, lol) "PIS RETE x 2y,, i21, 2, 3, ...., 7， 定 义 了 两 个 多 米 诺 骨牌 


pu pee pes 
HEEK 
[ [=v] 


由 多 米 诺 骨 牌 组 成 的 系统 是 
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E] E bd E 


E E 
| w | | w | 


构成 的 多 米 诺 骨 牌 序列 ， 其 中 任意 的 ws 10，1} * 。 当 构造 波斯 特 对 应 系统 C, ,的 解决 方法 的 时 候 ， 
我 们 可 以 自由 地 使 用 这 些 组 合 的 多 米 诺 骨 牌 。 
首先 我 们 证 明 当 wu zov Bb, C, ,存在 解决 方法 。 设 
UU FU >" u,v 

是 一 个 等 长 的 推导 。 规 则 0 一 0 和 1 一 1 确保 了 当 可 以 从 推导 出 v 的 时 候 ， 存 在 一 个 等 长 的 推导 。 推 
导 的 第 i 步 可 以 被 写成 

Ui- = Di 1X; |; 1 79Di AY |di-1 = Uj 
这 里 使 用 规则 x ,一 y; ,来 从 u, HES uo FRR 

[ Mo * Uy usus * +: * Up, us] 


就 是 C ,的 解决 方法 。 可 以 利用 下 面 的 方法 来 构造 解决 方法 。 


1. 开始 的 时 候 


2. 为 了 获得 匹配 ， 能 产生 底部 u =u 的 多 米 诺 骨牌 ， 需 要 进行 如 下 的 组 合 ， 


a" Po A 4o 
[ Po » do 
FH p, 和 gq, 构成 的 多 米 诺 骨 牌 都 是 复合 多 米 诺 肯 牌 。 中 间 的 多 米 诺 骨 牌 由 规则 x, —y,3Ky^ ^, 


3. 因为 py, do =w， 那 么 上 面 的 字符 串 必 须 写 上 [wu uy, 下面 的 字符 串 要 写 上 [us EALE 
的 策略 ,我 们 必须 在 底部 拼写 出 u, 








这 将 在 顶部 生成 [wo Ui * us * o 
4. RR HESERUREPRUZEUR2, 3... k-10 AUE 





5. 通过 下 面 的 多 米 诺 骨 牌 


:|- 
< | 一 


来 完成 这 个 序列 ， 从 而 能 够 在 底部 和 顶部 产生 [uo * Ran a, i8], MTR T DERE 
对 应 问题 。 


£123 不 可 敌人 定性 221 





我 们 将 证 明 可 以 通过 波斯 特 对 应 系统 C,, 的 解决 方法 来 得 到 从 z& v 的 推导 。C, ,的 解决 方法 必须 
以 下 面 的 多 米 诺 骨 牌 开 始 
因为 这 是 惟一 以 相同 符号 开始 的 多 米 诺 骨牌 。 同 样 的 原因 ， 解 决 方法 也 必须 以 下 面 的 多 米 诺 骨 牌 结束 。 


cay 


* y 


因此 ,解决 方法 中 的 字符 串 应 该 是 [u*w*v]。 如 果 w 包含 了 ] ,那么 解决 方法 必须 是 [u#x*v]y* 
v]。 因 为 ] 仪 出 现在 一 个 多 米 诺 骨 牌 中 ， 而 且 还 是 那个 多 米 诺 骨 牌 中 上 部 和 下 部 最 右边 的 符号 。 因 
此 ，[u*w*v] 同 样 也 是 C, ,的 解决 方法 。 

在 前 面 的 观察 中 ， 设 [u*… *v] 是 波斯 特 对 应 系统 C, ,的 解决 方法 ， 在 这 里 ] 只 作为 最 右边 的 
符号 出 现 。 多米诺 骨 牌 所 提供 的 信息 决定 了 整个 解决 方法 的 结构 。 解 决 方法 以 下 面 的 多 米 诺 骨 有 牌 
开始 。 


[Cu | 
wes 


因为 上 面 已 经 产生 了 wx， 所 以 多 米 诺 骨 牌 的 序列 能 够 拼写 出 uo Wu mx x, x, 是 解决 方法 中 能 够 在 底 
部 拼写 出 x& 的 序列 。 那 么 解决 方法 应 该 是 : 








因为 每 个 多 米 诺 骨 牌 都 代表 了 推导 x=>y;， 所 以 我 们 把 这 些 结合 在 一 起 就 能 够 得 到 u us, X Hu = 
Vidi Vio 在 构成 解决 方法 的 多 米 诺 骨牌 中 ， 它 们 所 组 成 的 顶部 的 字符 串 具 有 [xx * 形 式 的 前 级 ， 
而 底部 的 字符 串 觉 有 (ue 形式 的 前 级 。 重 复 这 个 过 程 ， 我 们 可 以 看 到 解决 方法 定义 了 下 面 的 字符 串 
序列 。 


[ux u, * u, e y] 
[u*u, * u, * Ua * * v] 
uj Superum] 


[u uus s RS nu, v] 
Kr u, Su, wu =u 而且 w=v。 将 这 些 组 合 在 一 起 可 以 得 到 推导 uv, 
前 面 的 两 个 证 明 构 成 了 从 半 图 厄 系统 中 的 词 问题 到 波斯 特 对 应 问题 的 归 约 。 这 样 就 证 明了 波斯 特 
对 应 问题 是 不 可 判定 的 。 fa 


12.7 上 下 文 无 关 文 法 中 的 不 可 判定 问题 


上 下 文 无 关 文法 为 定义 编程 语言 的 语法 提供 了 重要 的 工具 。 波 斯 特 对 应 问题 的 不 可 判定 性 可 以 
被 用 来 确定 一 些 与 上 下 文 无 关 文法 相关 的 重要 问题 的 不 可 判定 性 。 为 了 在 波斯 特 对 应 系统 和 上 下 文 
无 关 文法 之 间 建 立 起 来 联系 ， 我 们 使 用 波斯 特 对 应 问题 中 的 多 米 诺 骨牌 用 来 定义 两 个 上 下 文 无 关 文 
法 中 的 规则 。 

WC-(Xc. ÉD mi) De]... [sw 和 是 一 个 波斯 特 对 应 系统 。 我 们 从 C 的 有 序 对 出 发 
可 以 得 到 两 个 上 下 文 无 关 的 文法 Gu AG, : 


222 RERA Wi HH 

















Gy: Vy = {Sy I 
hires iru Weave pe = ,n| 
Py = |Sy—ujSyl ,Sy—uji| i21,2,....,n 
G,:V, 21S] 
dg Se Won} 
= {S.—yv,S,i,S,4>v,i| 121,2,.... ,n| 
可 以 将 判定 波斯 特 对 应 KBCAO QD E ee 应 的 文法 Gu AG, 中 是 否 具有 可 
推导 性 。 文 法 Gu 生成 的 是 将 在 多 米 诺 骨 牌 序列 中 上 半 部 分 出 现 的 字符 串 。 规 则 中 的 数字 将 记录 产生 
字符 串 的 多 米 诺 骨 牌 的 顺序 〈 或 者 相反 的 顺序 ) KMU, G 中 产生 的 字符 串 则 是 在 多 米 诺 骨 牌 序列 
中 的 下 半 部 分 出 现 。 
如 果 存 在 序列 lii, i, 使 得 
U, Ui Wi = Vi VeVi Va 


那么 波斯 特 对 应 系统 C 中 就 存在 解决 方法 。 在 这 种 情况 下 ， Gu AG, 中 包含 了 归 约 


Sy Puu,” "Wy Hull, ij "a 
Sı PV Vn VaV hia hi 
KB, uu, t, ull, tii =v v V Vaiia hiho AG, L(G) A L(G, ) 的 交集 不 为 空 。 
相应 的 ,假设 weL(G.) nL(G;) . 354 w LAT ERE W e ES MEFA Lots FR 
W' 2 u,u,*iW, us m V; Va Vi vule C 的 解决 方法 之 一 。 
$112. 7. 1 文法 Gy AIG, 是 从 例 12.6.1 中 的 波斯 特 对 应 系统 [aaa, aa] 和 [ baa, abaaaa] 中 


得 来 的 。 
Gu :Su —aaaS,1 | aaal Gi :$, —aa$,1 | aal 
—»baaS,2 | baa2 —abaaaS,2 | abaaa2 
能 够 给 出 波斯 特 对 应 问题 解法 的 推导 是 这 样 的 : 
Sy aaaSul S, —aa$,1 
=aaabaaS 21 —aaabaaasS, 21 
—aaabaaaaal21 =>aaabaaaaal21. 口 


波斯 特 对 应 问题 的 解法 与 文法 Gu 和 G 中 推导 之 间 的 关系 可 以 被 用 来 证 明 一 些 由 上 下 文 无 关 文 
法 得 到 的 问题 的 不 可 判定 性 。 

定理 12.7.1 没有 算法 能 够 判定 两 个 上 下 文 无 关 文 法 产生 的 语言 是 否 是 分 离 的 ( 即 交 集 为 空 )。 

WEBB: 假设 这 样 的 算法 存在 ， 那么 波斯 特 对 应 问题 便 可 以 通过 下 面 的 步骤 来 解决 : 

1. 对 于 任意 的 波斯 特 对 应 系统 C， 根 据 C 中 的 有 序 对 来 构造 文法 Gu 和 Go 

2. 利用 算法 来 判定 L(G) mL(CGu) 是 否 为 空 。 

3. C 存在 解决 方法 当 且 仅 当 L(G,) mL(Gu ) 不 为 空 。 

第 一 步 将 波斯 特 对 应 问题 归 约 到 判定 波斯 特 系统 产生 了 两 个 上 下 文 无 关 文 法 的 语言 是 否 分 离 。 因 为 波 

斯 特 对 应 系统 已 经 被 证 明 是 不 可 判定 的 ， 所 以 我 们 可 以 总 结 得 出 上 下 文 无 关 文法 产生 的 语言 是 否 分 离 

也 是 不 可 判定 的 。 a 
定理 12.7.2 没有 算法 能 够 判定 任意 的 上 下 文 无 关 文法 是 否 是 二 义 的 。 

证 明 : 如 果 在 上 下 文 无 关 文 法 中 ， 一 个 字符 串 可 以 用 两 种 不 同 的 推导 方式 得 到 ， 那 么 该 上 下 文 无 
关 文 法 是 二 义 的 。 如 前 面 一 样 ， 我 们 从 波斯 特 对 应 系统 C 开始 ， 并 构造 文法 Gy 和 GL。 将 这 些 文法 结 
合 在 一 起 就 可 以 得 到 文法 

L-15,5,,5,] 
ESEw 
P = P UP, U {S—S,,S—S, | 
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这 个 文法 从 S F, TUER LCG) UL(G,) 

G 中 所 有 的 推导 都 在 最 左边 ， 每 个 语句 形式 都 至 多 包含 一 个 变量 。G 中 的 推导 包含 了 使 用 $ 中 的 
规则 ， 并 使 用 Gy 或 G, 中 的 推导 。 文 法 Gu 和 GL 是 无 二 义 的 一 一 不 同 的 推导 生成 了 不 同 的 后 缀 。 这 
意味 着 G 是 无 二 义 的 当 且 仅 当 L(G,) mL(Gu ) 不 为 空 。 但 是 这 个 条 件 等 同 于 在 初始 的 波斯 特 对 应 系 
统 C 中 存在 相应 的 解决 方法 。 既 然 波斯 特 对 应 问题 可 以 归 约 到 判定 一 个 上 下 文 无 关 文 法 是 否 是 无 二 义 
的 ， 那 么 后 者 肯定 是 不 可 判定 的 。 m 

在 第 7. 5 节 中 ， 我 们 看 到 上 下 文 无 关 语 言 家 族 在 完整 性 上 不 是 闭合 的 。 然 而 ， 对 于 任意 的 波斯 特 
对 应 系统 C，L( GL ) 和 L(G ) 都 是 上 下 文 无 关 的 。 我 们 可 以 使 用 这 个 性 质 来 证 明 下 面 两 个 问题 的 不 可 
判定 性 : 对 于 任意 的 上 下 文 无 关 文 法 是 否 能 够 产生 字母 表 上 所 有 的 字符 串 ， 以 及 是 否 两 个 上 下 文 无 关 
的 文法 产生 了 同样 的 语言 。 

定理 12.7.3 没有 算法 能 够 判定 上 下 文 无 关 文 法 G= |L, ,PP,S| 的 语言 是 否 为 。 

证 明 : 首先 ， 注意 L= 有 “等同 于 L = 8。 我 们 将 证 明 没有 算法 能 够 判定 对 于 任意 的 上 下 文 无 关 文 
法 L(G) 是 否 为 空 。 

设 C 是 波斯 特 对 应 系统 ， 相 对 应 的 文法 是 Gu 和 GL。 能 够 产生 L(G ) UL (Gy) 的 文法 G' 可 以 直 
接 从 产生 L(Gu) 和 L(G ) 的 上 下 文 无 关 文 法 得 到 。 根 据 德 摩根 定律 L(G’) =L(G,) UL(G,). 

判定 任意 上 下 文 无 关 文 法 的 L(G) =Ø 的 算法 可 以 用 来 解决 波斯 特 对 应 问题 : 

L 对 于 波斯 特 对 应 系统 C， 构 造 文法 Gu A Go 

2. 构造 能 够 产生 L(Gu) RIL(G, ) 的 文法 。 

3. 从 能 够 产生 L( Gu) 和 L(G ) 的 文法 中 构造 G'。 

4. 使 用 判定 算法 来 判定 L(G') 2 0 是否 成 立 。 

5. L(G) =Ø 4AM4 L(Go)RÉÍL(G ) 是 分 离 的 ， 当 且 仅 当 C 有 解决 方法 。 

因此 没有 算法 能 够 判定 L(G) =O 是 否 成 立 ， 相 应 地 ， 也 不 能 判定 L(G) = “是否 成 立 。 国 

定理 12.7.4 没有 算法 能 够 判定 两 个 上 下 文 无 关 文 法 产生 的 语言 是 否 是 等 同 的 。 

证 明 : i C 是 波斯 特 对 应 系统 ， 相 对 应 的 文法 是 Gu 和 Gl。 如 同 在 定理 12.7.3 中 的 证 明 ， 可 以 
构造 上 下 文 无 关 的 文法 G， 来 产生 L(GL) UL(Gu) =L(Go) 咯 L(GL)。 第 二 个 上 下 文 无 关 文 法 G, 产 
ET Dy 上 所 有 的 字符 串 。 

L(G,)£& f X6 中 所 有 不 是 波斯 特 对 应 系统 解决 方法 的 字符 串 。 因 此,，L(G,) =L(G,) 4AM 
M C 中 不 包含 问题 的 解决 方法 。 相 应 地 ， 判 定 两 个 文法 产生 的 语言 是 否 相 同 的 算法 也 可 以 被 用 来 判定 


















































波斯 特 对 应 问题 是 否 有 解 。 a 

12.8 练习 

L. eae 即 ， 没 有 图 灵机 能 够 判定 对 于 通用 图 灵机 U 和 任意 的 输 
人 ， 计 算 会 不 会 停机 。 


2. 解释 例 11.5. 2 中 n 次 转换 停机 问题 和 图 灵机 停机 问题 区 别 ， 为 什么 前 者 是 可 判定 的 ， 而 后 者 是 不 可 判 
定 的 。 

3. 设 M 是 接受 非 递归 语言 的 确定 型 图 灵机 。 证 明 M 的 停机 问题 是 不 可 判定 的 。 即 ， 没 有 图 灵机 人 能够 判定 ， 
对 于 输入 w， 图 灵机 对 于 w 是 否 停机 。 
在 练习 4 到 练习 8 中 ， 使 用 归 约 来 建立 判定 问题 的 不 可 判定 性 。 

4. 证 明 没 有 算法 能 够 判定 对 于 任意 的 图 灵机 ， 当 输入 101 时 ， 计 算是 否 会 停机 。 

5. 证 明 没 有 算法 能 够 判定 对 于 任意 的 图 灵机 ， 是 否 会 对 至 少 一 个 输入 字符 串 停机 。 

6. 证 明 没 有 算法 能 够 判定 对 于 图 灵机 M = (Q, ,TT,6,4o,F) ， 状 态 q sQ, 字 符 串 we 王 ”， 针 对 w 的 计算 
是 否 会 进入 状态 dio 

7. 证 明 没有 算法 能 够 判定 对 于 任意 图 灵机 ， 在 最 终 的 转换 过 程 中 是 否 会 在 带 上 打印 1。 
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8. 证 明 没有 算法 能 够 判定 对 于 任意 的 图 灵机 ， 当 从 空白 带 开始 运行 时 ， 是 否 会 在 三 次 连续 的 转化 过 程 中 打 
印 1。 

9. 为 什么 我 们 不 能 用 下 面 的 方式 来 证 明 空 白带 停机 问题 是 不 可 判定 的 : 空白 带 停机 问题 是 停机 问题 的 子 问 
题 ， 而 停机 问题 是 不 可 判定 的 ， 因 此 它 也 是 不 可 判定 的 。 

10. 证 明 判 断 在 己 = 11] 上 的 字符 串 长 度 是 否 为 偶数 可 以 归 约 到 空白 带 停机 问题 。 为 什么 无 法 从 这 里 得 出 判 
定 字符 串 长 度 是 否 为 偶数 是 不 可 判定 的 。 

11. 给 出 一 个 任意 递归 可 枚 举 语 言 都 不 满足 的 性 质 。 

12. 使 用 莱 斯 定理 来 证 明 下 面 递归 可 枚 举 语言 的 性 质 是 不 可 判定 的 。 为 了 建立 这 种 不 可 判定 性 ， 所 要 做 的 
就 是 证 明 这 些 性 质 不 是 无 价值 的 。 
a) 工 包 含 了 特定 的 字符 串 w 
b) L 是 无 穷 的 。 
c) 工 是 正则 的 。 
d) L3é10; 1[*, 

13. L={R(M) | M 运行 RCM) 时 停机 | 。 
a) 证 明 工 不 是 递归 的 。 
b) 证 明 工 是 递归 可 枚 举 的 。 


*14. Lug = IRCM) | LM) 3EZS] * , 


a) WEH Lp AeA. 
b) 证 明志 -e 是 递归 可 枚 举 的 。 
15. 设 M 是 图 灵机 


a) 给 出 半 图 厄 系统 Sy 中 能 够 模拟 M 计算 的 规则 。 VIR 
b) 跟踪 当 输入 01 时 M 的 计算 过 程 ， 并 给 出 在 Sw 中 相应 的 und 


16. 找到 下 列 波斯 特 对 应 系统 中 的 解法 
a) [a, aa], [bb, b], [a, bb] 
b) [a, aaa], [aab, b], [abaa, ab] 
c) [aa, aab], [bb, ba], [abb, b] 
d) [a, ab], [ba, aba], [b, aba], [bba, b] 
17. 证 明 下 列 波斯 特 对 应 系统 不 存在 解 
a) [b, ba], [aa, b], [bab, aa], [ab, ba] 
b) [ab, a], [ba, bab], [b, aa], [ba, ab] 
c) [ab, aba], [baa, aa], [aba, baa] 
d) [ab, bb], [aa, ba], [ab, abb], [bb, bab] 
e) [abb, ab], [aba, ba], [aab, abab] 


"18. 证 明 对 于 仅 包含 一 个 符号 的 字母 表 上 的 波斯 特 系 统 ， 其 对 应 问题 是 可 判定 的 。 


19. (Rit P EEEL b, bbb] ,[ babbb, ba] [babp,aab] 和 [pa,a] 上 的 波斯 特 对 应 问题 。 
a) 给 出 P 的 解决 方法 。 
b) A PHE Gu # Go 
c) 给 出 (a) 中 解决 方法 在 Gu 和 G 上 对 应 的 推导 。 
20. 利用 波斯 特 对 应 系统 [5b,bb] 、[ aa, baa] 和 [ab,a] 来 构造 上 下 文 无 关 文 法 Gu 和 GL.。 那 么 L(Gu) A 
L(G,) =Ø 是否 成 立 ? 





"21. BEC 是 波斯 特 对 应 系统 ， 构 造 一 个 可 以 产生 L(Gu ) 的 上 下 文 无 关 文法 。 
“22. 证 明 没有 算法 能 够 判定 两 个 上 下 文 无 关 文 法 产生 的 语言 的 交集 ， 是 否 包 含有 限 个 元 素 。 


23. 证 明 没有 算法 能 够 判定 上 下 文 无 关 文 法 产生 的 语言 是 否 包含 有 限 个 元 素 。 


“24. 证 明 没有 算法 能 够 判定 两 个 上 下 文 无 关 文 法 G 和 G, 产生 的 语言 ， 是 否 满足 L(G,) CL(G,). 
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参考 文献 注释 


停机 问题 的 不 可 判定 性 由 图 灵 - [1936] 证 明 。 在 12.1 节 中 给 出 的 证 明 来 自 Minsky [1967]。 利 用 语言 
的 性 质 来 得 出 问题 的 不 可 判定 性 是 由 莱 斯 提出 的 【1953] 和 [1956], Thue 中 的 字符 串 转换 系统 由 Thue 
[1914] 引入 。 半 图 厄 系统 中 词 问题 的 不 可 判定 性 由 Post 得 出 [1947]。 

波斯 特 对 应 问题 的 不 可 判定 性 由 Post [1946] 提出 。 定 理 12. 6. 1 的 证 明 是 基于 Floyd [1964] 的 技术 ， 
来 自 Davis 和 Weyuker [1983] 。 上 下 文 无 关 语 言 的 不 可 判定 性 ， 包 括 定 理 12.7.1， 可 以 在 Bar- Hillel, 
Perles 和 Shamir [1961] 中 找到 。 上 下 文 无 关 语 言 二 义 性 的 不 可 判定 性 由 Cantor [1962], Floyd [1962] 
和 Chomsky, Schutzenberger [1963] 提出 。 固 有 的 二 义 性 问题 由 Ginsburg 和 Ullman [1966a] 证 明 是 不 可 
判定 的 。 
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第 13 章 Mu- 递归 函数 


在 第 9 章 中 ,我 们 从 机 器 的 角度 介绍 了 可 计算 性 ,通过 图 灵机 的 转换 可 以 得 到 函数 的 计算 值 。 丘 
奇 一 图 灵 论 题 证 明了 每 个 可 以 计算 的 函数 都 可 以 通过 这 种 方式 来 实现 。 但 是 究竟 什么 样 的 函数 才 是 图 
灵 可 计算 的 呢 ? 在 本 章 中 ,我 们 将 引入 这 个 问题 的 答案 ， 并 将 进一步 地 支持 丘 奇 一 图 灵 论 题 。 

我 们 已 经 从 宏观 的 角度 考察 了 可 计算 函数 。 下 面 ， 我 们 将 具体 考察 函数 而 不 是 图 灵机 计算 的 具体 
操作 。 我 们 将 引入 两 组 函数 : 原始 递归 函数 和 内- 递归 函数 。 原 始 递归 函数 是 由 一 组 可 计算 函数 通过 
组 合 操 作 和 原始 递归 操作 来 构造 的 。 而 -递归 函数 则 是 通过 增加 无 限制 的 最 小 化 和 顺序 查询 的 功能 
表示 构造 得 来 的 。 

原始 递归 函数 和 内 -递归 函数 的 可 计算 性 是 由 能 够 有 效 计算 函数 值 的 方法 来 展示 的 。 对 于 有 效 计 
算 的 分 析 是 通过 图 灵 可 计算 性 和 递归 性 的 等 价 来 完成 的 。 这 也 就 回答 了 开篇 提出 的 问题 一 一 能 够 被 
图 灵机 计算 的 函数 都 是 -递归 函数 。 


13.1 原始 递归 函数 


原始 递归 函数 ， 也 就 是 可 以 直接 计算 的 数论 函数 家 族 ， 是 通过 下 面 的 基本 函数 : 

i) 后 继 函 数 s:s(x) =x+1 

ii) FA% z:z(x) =0 

ii) 映射 函数 pi spi (x, °°, x,) =x,,1<i<n 
以 及 将 已 经 在 家 族 中 的 函数 利用 操作 符 构造 出 的 新 函数 来 完成 的 。 基 本 函数 的 简单 性 保证 了 它们 的 可 
计算 性 。 后 继 函 数 只 需要 在 自然 数 上 加 一 。 堆 函数 的 计算 更 是 简单 ， 对 所 有 的 参数 其 结果 均 为 0。 映 
射 函 数 p; 的 返回 值 就 是 它 的 第 i 个 参数 。 

原始 递归 函数 是 由 基础 函数 使 用 两 种 操作 构造 而 得 到 的 ， 这 两 种 操作 均 可 以 保持 它们 的 可 计算 性 。 
第 一 个 是 组 合 (在 9.4.2 节 定 义 )。 设 f 是 由 具有 nn 个 参数 的 函数 h 和 具有 上 个 参数 的 函数 8 ,8,,… ,8， 
组 合 的 。 如 果 组 合 中 的 每 个 成 分 都 是 可 计算 的 ， 那么 f(x,…,xi) 的 值 可 以 从 hh 和 gi (A), 
Ba (3, ,77,3,) 7,8, (Mk) 来 得 到 。 丰 的 可 计算 性 是 由 它 成 分 函数 的 可 计算 性 得 来 的 。 产 生 新 函数 
的 第 二 种 操作 就 是 原始 递归 。 

定义 13.1.1 设 g 和 hh 分 别 是 具有 nn 和 n+2 个 变量 的 数论 函数 。 那 么 具有 n+1 个 变量 的 函数 让 
定义 如 下 : 

i) f(x,,77,x,,0) = R(X) 

iJ. ft att eg PAL) yg" (XNA m) 
这 样 我 们 便 称 f 为 从 g 和 hh 进行 了 原始 递归 (primitive recursion), HP x, 被 称 为 原始 递归 的 参数 。 变 
量 y 是 递归 变量 。 

X g 和 刀 可 计算 的 时 候 ， 原 始 递 归 的 操作 提供 了 计算 f(x, ,… ,x ,y) 值 的 算法 。 对 于 一 组 固定 的 参 
Bx, An f(x, ，…,x,,0) 可 以 直接 从 函数 g 中 得 到 : 

FC xy 597% 0) (ns) 

F(x, xu 59 +1) AYE rh RETE PRÉC EA FIE FRI : 

i) 29 x,,-,x,, 

ii) y， 递 归 变 量 的 前 一 个 值 ， 以 及 

ii) f(x,… ,x,y) ;函数 的 前 一 个 值 。 

例如 ， 我 们 可 以 从 下 面 的 计算 中 得 到 f(x ,… ,x, ,y+1) 

fx 13,0) Sg rre) 
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f(x $5 9x ST) =h(x, Pee ae) OH Ae 9 Xn ,0)) 
f(x, 97°" X, 2) =h(x, 97° ,Xn ol f(x aed sw A 


fn, x, y 1) HRCA, xf x 9): 
因为 疡 是 可 计算 的 ， 所 以 这 个 迭代 的 过 程 可 以 用 来 确定 对 于 任意 的 递归 变量 了， 帮 (2 ，… xuy +1) 
的 值 。 
定义 13.1.2 如果 一 个 函数 可 以 从 后 继 函 数 、 零 函数 和 映射 函数 经 过 一 系列 的 组 合 和 原始 递归 而 
得 到 ， 那 么 该 函数 就 可 以 被 称 为 是 原始 递归 的 (primitive recursive) o 
经 过 一 系列 的 组 合 以 及 原始 递归 得 到 的 完全 函数 仍然 还 是 完全 的 。 这 一 点 可 以 从 操作 的 定义 中 直 
接 得 到 ， 我 们 把 证 明 过 程 留 作 练 习 。 因 为 基本 的 原始 递归 函数 都 是 完全 的 ， 而 操作 保持 了 完全 性 ， 所 
以 所 有 的 原始 递归 函数 都 是 完全 的 。 
我 们 将 组 合 和 原始 递归 结合 在 一 起 可 以 得 到 构造 函数 的 强 有 力 工 具 。 接 下 来 的 例子 证 明了 对 于 任 
意 的 常数 函数 ， 加 、 乘 和 阶乘 ， 都 是 原始 递归 函数 。 
例 13.1.1 常数 函数 cf" (x, ux) =i 都 是 原始 递归 函数 。 例 9.4.2 定义 了 如 何 将 常数 函数 视 为 
后 继 函 数 、 零 函数 和 映射 函数 的 组 合 。 I 
例 13.1.2 我们 可 以 将 add 函数 视 为 8(x) =x Mh(x,y,z) =z+1 的 原始 递归 。 和 那么 
add(x,0) 2g(x) 2x 
: add(x,y +1) =h(x,y,add(x,y)) =add(x,y) +1 
add 函数 计算 了 两 个 自然 数 的 和 。add(x,0) 的 定义 表明 了 任何 数 与 零 的 和 都 是 自身 。 后 面 的 等 式 定义 
了 x 和 y+1 的 和 是 将 zx 和 >y 的 和 (add 函数 中 对 于 递归 变量 的 前 一 个 结果 ) 再 加 一 。 
前 面 的 定义 说 明了 加 函数 是 原始 递归 的 。 根 据 原始 递归 的 定义 ，g 和 户 也 都 是 原始 递归 的 ， 因 为 
g-pi 而 且 h=sop!’。 
两 个 自然 数 进行 加 的 结果 可 以 从 add 函数 的 原始 递归 定义 中 得 出 ， 我 们 可 以 重复 地 执行 条 件 
add(x,y+1) =add(x,y) +1 来 归 约 出 递归 变量 的 值 。 例 如 : 
add(2,4) =add(2,3) +1 
=(add(2,2) +1) +1 
=((add(2,1) +1) +1) +1 
=(((add(2,0) +1) +1) +1) +1 
=(((2+1) +1) 41) +1 
=6 
当 递归 变量 成 为 零 的 时 候 ， 函 数 8 就 可 以 用 来 初始 化 表达 式 的 计算 。 口 
例 13.1.3 设 g 和 有 都 是 原始 递归 函数 ，g =z,h=addo (ps p ) 。 乘 法 可 以 利用 g 和 有 进行 原 
始 递 归来 定义 : y 
mult(x,0) 2 g(x) =0 
mult(x,y +1) 2 h(x,y,mult(x,y) ) 2 mult(x,y) +x 
插入 的 表达 式 对 应 了 原始 递归 的 定义 ,x* (y+1) =x yx, 这 也 对 应 了 加 和 乘 的 分 配 性 。 Br 
我 们 可 以 根据 13. 1. 1 中 的 定义 ， 使 用 原始 递归 和 两 个 变量 的 函数 疡 来 定义 一 个 变量 的 函数 。 这 样 
的 函数 8 定义 如 下 
i) f(0) =m, XE meN 
ii) f(y*1) 2 h(y.f(y)) 
例 13.1.4 仅 有 一 个 变量 的 函数 
1 如 果 y=0 


fact (y) "lm. s» 
是 原始 递归 的 。 设 h(x,y) 2 multo (pP) sop ) =y- (x+1)。 可 以 使 用 从 4 开始 的 原始 递归 定义 来 
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定义 阶乘 函数 
fact(0) =1 
fact(y +1) =h(y,fact(y)) =fact(y) + (y +1). 
注意 ， 这 里 的 定义 采用 的 递归 变量 的 值 是 y+1。 这 可 以 通过 y 的 后继 函数 ， 提供 给 h 函数 的 值 来 
得 到 。 
下 面 列 出 的 fact 函数 的 前 五 个 输入 值 对 应 的 结果 ， 解释 了 如 何 使 用 原始 递归 定义 来 执行 计算 ; 
fact(0) =1 
fact(1) =fact(0) + (0.1) 21 
fact(2) =fact(1) + (141) 22 
fact(3) =fact(2) - (241) 26 
fact(4) =fact(3) - (3 41) 224 
阶乘 函数 通常 被 表示 为 fact(x) =xl。 口 
原始 递归 函数 是 一 组 可 以 计算 的 函数 。 丘 奇 一 图 灵 论 题 证 明了 这 些 函数 同样 必须 是 可 以 使 用 图 灵 
机 方法 计算 的 。 下 面 的 定理 13. 1. 3 将 会 对 这 一 点 进行 证 明 。 
定理 13.1.3 每 个 原始 递归 函数 都 是 图 灵 可 计算 的 。 
证 明 : 我 们 已 经 在 9.2 节 中 建立 了 用 来 执行 基本 函数 计算 的 图 灵机 。 为 了 完成 证 明 ， 我 们 要 证 明 
图 灵 可 计算 的 函数 在 组 合 和 原始 递归 的 操作 下 是 封闭 的 。 前 者 已 经 在 9. 4 节 得 到 了 证 明 。 现在 需要 证 
明 的 是 图 灵 可 计算 函数 在 原始 递归 操作 下 是 封闭 的 。 即 ， AR f Jh 图 灵 可 计算 函数 h 和 g 原始 递归 
得 来 的 ， 那么 f 是 图 灵 可 计算 的 。 
BAA g 是 图 灵 可 计算 的 函数 ， 利 用 它们 进行 原始 递归 而 得 到 的 函数 了 定义 如 下 : 
a e UD -2g(5,-,x,) 
fon xy +1) 8 hs my fn ux 5 Y)) 
因为 h 和 g 是 图 灵 可 计算 的 ， 那么 就 存在 标准 图 灵机 G AH RT EGRE EHE] 可 以 构造 一 个 组 合 的 机 器 
RITE fo AF fy x,y) AO, SEA EASE B x, Bx, B-B x, B YB 开始 的 。 
l. 首先 在 输入 的 右边 紧 接着 写 上 一 个 计数 器 ， 并 将 它 初始 化 为 0。 计数 器 用 来 对 当前 计算 中 递归 
变量 的 值 进行 计数 。 接 下 来 在 计数 器 右边 写 上 参数 ， 从 而 产生 如 下 的 配置 ， 
B x, B x,B---B x,B yB OB x, B x,B---B x,B. 
2. 接 下 来 在 G 上 运行 带 上 最 后 的 n 个 值 ， 产 生 
Bx,Bx,B--Bx,B yB OB g(x,,x, ,-- x) 
G .上 的 计算 产生 了 glaistas ) mf x0). 


3. 现在 带 上 的 格式 是 
Bx,Bx,B--Bx ,B yB iB f(x X, ,-7,x, ,D)B 
如 果 计 数 器 i 等 于 y， 那 么 关于 f(x ox ，,.…. ,x uy) 的 计算 就 擦 除 带 上 开始 的 n+2 个 数字 ， 并 将 结 
果 放 在 带 上 的 第 一 个 位 置 。 
4. 如 果 i<y， 那么 为 了 计算 7 的 下 一 个 值 ， 我 们 要 对 带 进行 重新 配置 。 
Bx Bx,B--Bx,ByBi * IBx,Bx,B--Bx,B iB f(x, x) ,-,x, i) B 
使 用 HH 来 运行 带 上 最 后 的 n+2 个 值 ， 产生 了 
B x,B x,B---Bx,B yBi+1B h(x, ,x, ,--,x, i f(x, 34 7x, I) )B, 
这 里 带 上 最 右边 的 值 是 f(x x ，,…,x, ,i+1)。 计 算 接 下 来 继续 执行 第 三 步 中 的 比较 。 [is] 


13.2 一 些 原始 递归 函数 


如 果 一 个 函数 可 以 利用 后 继 函 数 、 零 函数 和 映射 函数 ， 经 过 有 限 步 地 使 用 组 合 和 原始 递归 得 到 ， 
那么 这 个 函数 是 原始 递归 函数 。 在 原始 递归 函数 的 定义 中 ,组 合 操作 允许 利用 任何 已 经 被 证 明 具有 原 
始 递归 性 质 的 函数 。 

原始 递归 定义 是 从 一 些 基 本 的 算法 函数 中 得 到 的 。 不 同 于 8 和 无 直接 给 出 细节 的 信息 ,原始 递归 





B 133 Mu-x# 7 HH 229 





的 定义 是 通过 参数 、 递 归 变量 、 函 数 以 前 的 值 以 及 其 他 的 原始 递归 函数 来 给 出 的 。 需 要 注意 到 这 里 的 

加 函数 和 乘 函数 等 同 于 在 例 13. 1. 2 和 例 13. 1. 3 中 给 出 的 形式 化 定义 ， 只 是 此 处 省 略 了 中 间 的 步骤。 
因为 组 合 和 原始 递归 操作 的 兼容 性 ， 表 13-1 和 表 13-2 中 的 定义 都 是 用 函数 符号 来 给 出 的 。 表 13-1 

的 第 三 列 中 给 出 的 是 函数 中 级 表示， 它 将 在 整 章 中 用 作 代 数 表达 式 。 符 号 “+1” 代 表 了 后 继 操 作 符 。 


表 13-1 原始 递归 算术 函数 








JS xk BOO X x 
加 法 add( x,y) add(x,0) =x 

x+y add(x,y +1) =add(x,y) +1 
乘法 mult( x,y) mult(x,0) «0 

x*y ' mult(x,y +1) 2 mult(x,y) +x 
前 驱 pred( y) pred(0) =0 

pred(y *1) =y 

合适 减法 sub(x,y) sub(x,0) =x 

x-y sub(x,y +1) =pred(sub(x,y)) 
指数 运算 exp( x,y) exp(x,0) =1 

x exp(x,y +1) =exp(x,y) +x 


原始 递归 谓词 是 值 域 在 10,1} 上 的 原始 递归 函数 。0 和 1 分 别 代表 了 假 和 真 。 在 表 13-2 中 的 前 两 
个 谓词 是 符号 谓词 ， 它 说 明了 参数 的 符号 。 当 参数 是 正 数 的 时 候 ， 函 数 sg 返回 真 ; 符号 谓词 的 补 表示 
为 cosg， 当 输入 为 0 时 ，cosg 返回 真 。 可 以 利用 算术 函数 和 符号 谓词 进行 组 合 来 得 到 用 于 比较 输入 的 
二 元 谓词 。 
表 13-2 原始 递归 谓词 








Ho 述 Boom gue 
符号 sg(x) sg(0) «0 
sg(y+1)=1 
符号 的 补 cosg(x) cosg(0) =1 
cosg( y +h) =0 
小 于 lt(x,y) sg( yx) 
RF gt(x,y) sg(x--y) 
ST eq(x,y) cosg( lt(x,y) + gt(x,y)) 
不 等 于 ne(x,y) cosg(eg(x,y) ) 
谓词 是 表明 提出 问题 正确 与 否 的 函数 。 它 的 一 些 逻 辑 计 算 , 例 谓词 解释 
如 取 反 、 合 取 和 析 取 可 以 使 用 算术 运算 函数 以 及 符号 谓词 来 构造 。 cosg(p, ) p, 取 反 
假设 p, Al p. 是 两 个 原始 递归 谓词 ，p, 和 p; 的 逻辑 操作 可 以 按照 如 Piee p p 
右 表 所 示 的 定义 来 完成 。 BE CV ETUR 


fi RH cosg 可 以 对 谓词 的 结果 进行 取 反 。 这 个 技术 还 可 以 被 用 来 使 用 谓词 eq 来 定义 谓词 nes 析 取 
计算 的 值 是 将 所 有 部 分 谓词 的 结果 进行 加 和 。 因 为 两 个 谓词 都 为 真 ， 那么 经 过 加 和 得 到 的 结果 是 2， 
利用 sg 谓词 可 得 到 该 结果 。 因 为 组 合 中 所 有 的 成 分 都 是 原始 递归 的 ， 所 以 结果 谓词 也 是 原始 递归 的 。 

例 13.2.1 等 于 谓词 可 以 用 来 显示 地 声明 拥有 有 限 参数 的 函数 的 值 。 例 如 ，j 是 一 个 除了 对 于 0、 
1 和 2 都 返回 自身 值 的 函数 : 


2 ”如 果 x=0 f(x) 2eq(x,0) -2 


M 5 Wm xs=1 +eq(x,1) -5 
RiT 4 如果- 和 =2 +eq(x,2) *4 
x 其 他 +gt(x,2) +x. 


函数 了 是 原始 可 递归 的 ， 因 为 它 可 以 被 表示 为 原始 递归 函数 egs gt, + 和 + 的 组 合 。f 的 四 个 谓词 是 穷 
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举 的 而 且 是 互 斥 的 。 即 ， 对 于 任意 的 一 个 自然 数 ， 它 们 里 面 有 上 且 只 有 一 个 为 真 。 7 的 值 都 是 由 为 真 的 
谓词 所 对 应 的 值 来 决定 的 。 口 
在 前 面 的 例子 中 使 用 穷 举 而 且 是 互 斥 的 谓词 来 构造 函数 的 技术 ,将 被 用 来 证 明 下 面 的 定理 。 

定理 13.2.1 设 g 是 原始 递归 函数 , f 为 全 函数 。 除了 有 限 个 输入 的 值 , f 所 有 其 他 的 值 均等 同 于 
go 那么 f 也 是 原始 递归 的 。 
证 明 : 设 g 是 原始 递归 的 ， 并 且 定 义 了 如 下 : 
» WR x =n, 
X3; 如 果 x-n 
f(x) 24: 
|» WÈ xn 
g(x) 其 他 . 
等 于 谓词 用 来 声明 对 于 输入 为 n, ,…,n, 的 f 的 值 。 对 于 其 他 的 输入 值 ，f(x) = g(x)。 当 f 的 值 是 由 g 
来 决定 时 ， 通 过 下 面 乘积 得 到 的 谓词 为 真 ; 
ne(x,n,) * ne(x,n,) + ++ + ne(x,n,) 
使 用 这 些 谓词 ， 可 以 将 f 写 为 : 
f(x) =eq(x,m) + y, +eq(x,n,) * yo +eq(x,m,) * y, 
+ne(x,n,) * ne(x,n,) *  * ne(x,n,) + g(x) 
因此 j 也 是 原始 递归 的 。 m 
变量 的 顺序 是 原始 递归 定义 中 一 个 重要 的 特色 。 初 始 的 变量 都 是 参数 ， 最 终 的 变量 是 递归 恋 量 。 
将 组 合 函数 和 映射 函数 结合 在 一 起 ， 可 以 在 声明 原始 递归 函数 中 变量 的 数目 和 顺序 时 带 来 很 大 的 灵活 
性 。 在 拥有 两 个 变量 的 函数 中 ， 这 种 灵活 性 是 通过 考虑 对 变量 进行 替换 来 展示 的 。 
定理 13.2.2 设 g(x,y) 是 原始 递归 函数 。 那 么 通过 下 面 列举 的 方式 来 构造 的 函数 同样 也 是 原始 
递归 的 。 
i) (Ark €) f(x,y,z.n,sz) gy) 
ii) (政变 变量 顺序 ) f(x,y) 2g(y,x) 
ii) (识别 变量 ) f(x) =g(x,x) 
证 明 : 每 个 函数 都 是 原始 递归 的 ， 因 为 可 以 它们 通过 g 和 投影 函数 使 用 下 面 的 组 合 得 到 
= om pe) 


ii) f=go (py. p^) 


iii) f- go (pi pi) m 

哑 变 量 可 以 让 具有 不 同 变 量 数目 的 函数 能 够 进行 组 合 。 组 合 ho (8 ;8 ) 中 需要 g Ag, 具有 相同 
数目 的 变量 。 对 于 两 个 变量 的 函数 所 xz,7) = (x * y) +xl!， 其 两 个 构成 成 分 是 乘法 和 阶乘 。 前 面 的 乘 潜 
有 两 个 变量 ， 而 后 面 的 阶乘 具 需 要 一 个 变量 。 可 以 在 后 面 的 阶乘 函数 中 增加 一 个 三 变量 ， 从 而 构造 拥 
有 两 个 变量 的 函数 .如 ct (x,y) =fact(x) =x!。 最 终 我 们 可 以 得 到 f=addo (mult, fact") ， 所 以 让 也 是 原 
始 递归 的 。 


19.83 BARRIER 


对 一 系列 自然 数 进行 求 和 可 以 通过 重复 地 使 用 加 法 操作 来 完成 。 可 以 将 加 法 和 投影 函数 结合 起 
来 ， 从 而 构造 一 个 增加 固定 数目 参数 的 函数 。 例 如 ， 原 始 递归 函数 
add o (pi^ ,add o (pi^ ,add o (pi? „p$? ))) 


返回 的 是 四 个 参数 的 和 。 当 求 和 的 数目 是 变量 的 时 候 ， 这 个 方法 是 无 法 使 用 的 。 函 数 
fo) = $, g(i) =8(0) +8(1) +- +80) 
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参与 加 法 的 变量 数目 是 由 输入 变量 y KREN. PBS BK 8 的 有 界 和 (bounded sum) 。 变 量 i 
是 和 的 下 标 。 计 算 有 界 和 包含 了 三 个 操作 : 产生 被 加 数 ， 进 行 两 两 加 法 ,将 下 标 和 输入 y 进行 比较 。 
接 下 来 我 们 要 证 明 求 有 界 和 的 函数 是 原始 递归 的 。 这 里 使 用 的 技术 可 以 用 来 证 明 重复 地 使 用 任意 
的 三 元 原始 递归 操作 得 到 的 函数 同样 是 原始 递归 的 。 
定理 13.3.1 设 8(2 zy) 是 原始 递归 函数 。 那 么 下 面 的 函数 都 是 原始 递归 的 : 


D GEO Gs x) =D) genau D 


ii) (ARRP), = TP ead 
WEBB: 有 界 和 
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FETE gx ux, Y) RI 


z 人 
相 加 得 到 的 。 
将 它 转换 为 原始 递归 的 语言 ， 我 们 可 以 得 到 
ENESE X, ,0) = EX Li x, 0) 
FON 5 3S E E) SPUR esta dD + a(x, ,°**,x, 9 1) E 
有 界 操 作 从 零 开始 ， 并 重复 进行 ， 直 到 下 标 达 到 了 参数 y 所 声明 的 值 才 停止 。 通 过 两 个 可 计算 函 
数 来 确定 下 标 变量 的 值 域 ， 从 而 将 有 界 操 作 进 行 泛 化 。 函 数 1 和 分 别 确定 了 下 标的 下 界 和 上 界 。 
定理 13.3.2 设 g 是 具有 n+1 个 变量 的 原始 递归 函数 ， 并 且 让 1 和 分 别 表示 具有 nn 个 变量 的 原 
始 递归 函数 。 那 么 下 面 的 函数 也 是 原始 递归 的 : 


u(x,, x,) 


i) Pg dE) = > A S) 


izl(x nux) 


u(x, Xn) 
ii) faet) II gn ux, 54) 
x,) 


isl(x,, 


证 明 : 因为 求 和 的 上 界 和 下 界 都 是 由 函数 ! 和 六 来 确定 的 ， 那么 有 可 能 下 界 会 比 上 界 更 大 一 些 。 
当 这 种 情况 发 生 的 时 候 ， 我 们 把 求 和 的 结果 设 定 为 0。 在 这 些 实例 中 ， 谓 词 
EECC yesan) UCA y ) 
始终 为 真 。 
如 果 产 生 的 下 界 小 于 或 者 等 于 上 界 ， 那 么 求 和 就 应 该 从 H(x,,*7,x,)9 28, PBK u(x 7, 
Xx,) 时 停止 。 设 g' 是 原始 递归 函数 
g On 77,3) 2806,77, On 5%) ) 
8" 的 值 是 由 g 和 1 (x,, rn, x,) 得 到 的 。 
g On ,77,x,0) = BCH, 7x10 x) 
8 O5 ,77,x,,1) 2808,77, x, eI), x,)) 
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根据 定理 13. 3. 1， 下 面 的 函数 


f(y ye E yum 
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也 是 原始 递归 的 。 泛 化 的 有 界 和 可 以 通过 将 函数 /和 w 以 及 f BET GE ERI: 
5,7752.) 
f Gn os CQ nmm) HOS OY gos 
iz ) 


将 这 个 函数 与 比较 上 界 下 界 的 谓词 进行 乘积 ， 可 以 保证 当下 界 超过 上 界 的 时 候 ， 有 界 和 函数 总 是 返回 
默认 值 。 因 此 
Jn ,* vx.) = cosg(gt( Ix, ,x,) un x))) 
Gu Cn uae) Gs v ED De 

因为 式 子 里 面 每 个 组 成 的 函数 都 是 原始 递归 的 ， 所 以 了 同样 也 是 原始 递归 的 。 

可 以 使 用 类 似 的 过 程 来 证 明 泛 化 的 有 界 乘 积 也 是 原始 递归 的 。 当 下 界 超过 上 界 的 时 候 ， 有 界 乘积 
函数 总 是 返回 0。 ral 

谓词 p 返回 的 值 表明 了 输入 是 否 满足 属性 p。 对 于 固定 的 值 x, ,… ,x,， 我 们 可 以 使 用 

pat pn, 2 22] 
来 表示 满足 P(z ,… ,x ,z) =1 的 最 小 自然 数 z。jz[p(xi，…,x,,z) ] 被 称 为 “满足 p(xi，,…,x,,z) 的 最 
小 z”。 这 种 构造 方式 可 以 称 为 p 的 最 小 化 。jz 被 称 为 多 操作 符 。n +1 个 变量 谓词 的 最 小 化 定义 了 一 
个 到 元 的 函数 : 
AG teres 20) -uz| p(x, yx. E) Ike 
对 于 最 小 化 ， 一 个 直观 的 解释 是 它 在 自然 数 中 执行 了 查询 。 在 开始 的 时 候 ， 变 量 z 被 设 定 为 零 。 查 询 
对 自然 数 进行 顺序 的 检查 ， 直 到 发 现 有 z 满 足 p(x,,…,x,,z) =1。 

不 幸 的 是 ， 由 原始 递归 谓词 得 到 的 最 小 化 函数 并 不 需要 是 原始 递归 的 。 实 际 上 ， 这 个 函数 甚至 不 

必 是 完全 的 。 考 虑 下 面 的 函数 
f(x) =pzleq(x,z + z) ]. 

利用 最 小 化 的 特点 进行 查询 ，f 首先 查找 第 一 个 满足 z =x 的 z。 如 果 x 的 平方 根 是 个 整数 ， 那 么 FLzx) 
就 返回 x 的 平方 根 。 否 则 ,f 便 没有 定义 。 

通过 对 最 小 化 的 值 域 进行 限制 ， 我 们 可 以 得 到 有 界 的 最 小 化 操作 符 。n +1 个 变量 的 谓词 定义 了 具 
有 n+1 个 变量 的 函数 

Fay Lp(a 


z 如 果 p(x, ,-+,x,,1) =0 ,其 中 0 <i<z<y 
= pay r,t) =1 
y+1 ”其 他 。 


AR u 操作 符 返 回 的 是 满足 p(x ,…,x,,z) =1 并 且 小 于 或 者 等 于 y 的 第 一 个 自然 数 z。 如 果 这 样 的 值 
不 存在 ， 那 么 它 就 返回 默认 的 y+1。 通 过 将 查询 的 范围 缩小 至 0 和 y， 整 个 函数 的 完整 性 便 可 以 得 到 
f(x; 9°" X, ) =pz[ p(x, ok, 2) ]. 
实际 上 ， 当 谓词 是 原始 递归 的 时 候 ， 有 界 最 小 化 操作 符 定 义 的 是 一 个 原始 递归 函数 。 
定理 13.3.3 设 f(xi,…,x,,y) 是 原始 递归 谓词 ， 那 么 函数 


f(x, 9 °° Xu ») =pz[ p(x, a AR ,£)] 


也 是 原始 递归 的 。 
WERA: 证 明 给 出 了 一 个 两 元 谓词 ， 并 可 以 很 容易 地 泛 化 到 具有 n 个 变量 的 谓词 上 去 。 我 们 定义 这 
样 一 个 谓词 


1 如 果 p(x,i) =0, 其 中 0 <i<y 
0 其 他 

= II cosg(p(x,i) ). 
这 个 谓词 是 原始 递归 的 ， 因 为 它 是 原始 递归 谓词 cosg op 的 有 界 乘积 。 


g(x,y) -[ 
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有 和 界 和 的 谓词 p 产生 了 有 界 的 操作 符 。 为 了 解释 如 何 使 用 p Se PO IME PRE TE, RIEA 
参数 n 来 构造 一 个 有 两 个 变量 的 谓词 p»， 具体 的 值 在 下 面 给 出 : 


p(n,0)=0  g(n0)-1 Y, ald) =1 


p(n,l)=0 g(n,1)=1 Y, sono =2 


pU2)90 gina) =1 Y, a(n, i) =3 


i=0 
3 


p(n,3) =1 g(n,3) =0 >? g(n,i) =3 


i=0 
4 


p(n4)-0  g(n4)-0 — Y g(n,) =3 


i=0 
5 


p(n,5)=1  g(n,5)s0 Y, a(n, i) =3 


i=0 


g 的 值 始终 都 为 1!， 直 到 出 现 第 一 个 满足 p(n,z) =1 的 z。 接 下 来 gs 所 有 的 值 均 为 0。 有 界 和 加 上 了 由 8 
产生 的 值 。 因 此 ， 
> ties = tie WAR z>y 
: z 其 他 。 
第 一 个 条 件 同样 包含 了 没有 z 满 足 p(n,z) =1 的 可 能 性 。 在 这 种 情况 下 ， 我 们 将 直接 返回 默认 值 。 
利用 前 面 的 证 明 ， 我 们 可 以 看 到 有 界 的 原始 递归 谓词 p 是 由 函数 


f(x,y) = zt p(x,z) ] D g(x,i), 


给 出 的 ， 因 此 也 是 原始 递归 的 。 

有 界 最 小 化 Ay) = 上 z[P(x,z)] 可 以 被 视 为 在 值 域 0 到 y 之 间 寻 找 第 一 个 使 p 为 真 的 值 。 
13. 3. 1 表明 了 最 小 化 同样 可 以 被 用 于 在 一 个 子 值 域 中 寻找 第 一 个 满足 条 件 的 值 ， 或 者 在 指定 的 值 域 中 
寻找 满足 p 的 最 大 的 zo 

例 13.3.1 如 果 p(x,z) 是 原始 递归 的 谓词 。 那 么 

i) f(x,yo,y) = EER y y] 内 第 一 个 使 p(x,z) 为 真 的 值 ， 

ii) f(x,y) = 在 值 域 [0,y] 内 第 二 个 使 p(x,z) 为 真 的 值 ， 

ii) f(x,y) = 在 值 域 [0,y] 内 使 p(x,z) 为 真 的 最 大 值 。 
这 些 函 数 同样 也 是 原始 递归 的 。 对 于 这 些 函 数 ， 如 果 没 有 z 能 够 满足 规约 的 条 件 ， 那 么 默认 的 值 
Ay +1. 

为 了 证 明 是 原始 递归 的 ， 我 们 使 用 原始 递归 的 函数 ge (大 于 或 等 于 ) 来 保证 函数 值 的 下 界 。 
当 P(x,z) 为 真 ， 而 且 z 大 于 或 者 等 于 WN, Wiel p(x,z) .8e(z,yo) 为 真 。 有 界 最 小 化 

fi Go») 2uz px, z) eC ys 

能 够 返回 在 值 域 L[ yo ,y] 内 第 一 个 使 p(x,z) 为 真 的 值 。 

最 小 化 几 z'[p(x;z')] 是 在 值 域 [0,y] 内 第 一 个 使 p(x,z) 为 真 的 值 。 而 第 二 个 使 p(x,z) 为 真 的 值 
则 是 满足 p 而 且 大 于 jw z'[p(x,z') ] 的 第 一 个 值 。 使 用 前 面 的 技术 ,函数 

Dey) nlp z) * gtz,uz'Dp(x,2)1)] 

则 返回 了 在 值 域 [0,y] 内 第 三 个 使 p(x,z) 为 真 的 值 。 

在 值 域 [0,y] 内 寻找 最 大 值 需 要 在 y,y -1,y -2,…,1,0 中 顺序 进行 查找 。 有 界 最 小 化 jz[p(x,y 一 
z) ] 按 照 指定 的 顺序 来 进行 检查 。 当 z=0 时 ， 就 测试 p(x,y); 当 z=1 时 ， 就 测试 p(x,y -1)， 如 此 继 
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St PASS RAS (x,y) =y - uz Lp Gc y 2) ] 返 回 了 满足 p 而 且 小 于 或 者 等 于 y 的 最 大 值 。 然 而 ， 当 这 样 
的 值 不 存在 的 时 候 , FREE yO +1) 20, 这 里 要 进行 比较 从 而 返回 正确 的 默认 值 。 函 数 
f Gy) =eq(y +1 ,uz[p(x,z)]) * (y +1) +neq(y +1 zi p(x,z)]) < f (x,y)) 

中 第 一 个 条 件 能 够 在 值 域 [0,y] 内 没有 值 满足 p 时 返回 默认 的 y+1。 否 则 ,就 返回 最 大 的 值 。 口 

利用 函数 u 来 计算 查询 的 上 界 便 可 以 泛 化 有 界 最 小 化 。 如 果 u 是 原始 递归 的 ， 那么 相应 的 函数 也 
是 。 证 明 过 程 和 定理 13. 3. 2 类似， 留 作 练习 。 

定理 13.3.4 设 p 是 具有 n+1 个 变量 的 原始 递归 谓词 ， 设 下 是 具有 个 变量 的 原始 递归 函数 。 
那么 函数 

fg e) fe "Tas 9 ** y X. SAM 

也 是 原始 递归 的 。 


13.4 除法 函数 


整数 除法 (di ) 的 基本 操作 并 不 是 全 函数 。 函 数 div (x, y) 返回 的 是 使 用 x 除 以 y 所 得 的 整数 部 分 ， 
而 且 要 求 第 二 个 参数 不 能 为 0。 而 当 y 为 0 时 ， 函 数 是 没有 意义 的 。 因 为 所 有 的 原始 递归 函数 都 是 全 
函数 ， 所 以 div 函数 不 是 原始 递归 的 。 如 果 我 们 定义 当 y 为 0 时 ， 函 数 返 回 一 个 默认 值 ， 便 可 以 得 到 
一 个 原始 递归 的 函数 quo: 
0 如 果 y=0 
div(x,y) 其 他 。 
使 用 乘法 的 原始 递归 操作 可 以 构造 除法 函数 guo。 对 于 每 个 非 零 的 数 ，gquo(x,y) =z 意味 着 z 满 足 z.y 
Xx< (z+1) .y。 即 ，quo(x,y) 返 回 的 是 满足 (z+1) -y 大 于 x 的 最 小 的 z。 寻 找 z 的 过 程 在 z 到 达 x 
之 前 就 会 成 功 ， 因 为 (z+1) . y 比 x 要 大 。 函 数 

Mz[ gi( (z+1) + y,x)] 
确定 了 当 除 法 div 存在 定义 时 ,x Aly 的 商 。 默认 值 是 由 将 最 小 化 和 sg(y) 相 乘 得 到 的 。 因 此 ， 在 
quo(x,y) =sg(y) * uzL gt( (z+1) * y,x], 

中 ,边界 是 由 原始 递归 函数 pl!” 决 定 的 。 前 面 的 定义 证 明了 quo 是 原始 递归 的 ， 因 为 它 具 有 定理 
13. 3. 4 中 所 描述 的 形式 。 

求 商 的 函数 可 以 用 来 定义 表 13-3 中 一 系列 包括 和 除法 相关 的 函数 和 谓词 。 函 数 rem 返回 了 当 除法 
有 定义 时 ,x 和 y 执行 除法 之 后 的 余数 。 否 则 ，rem(x,0) =x。 谓 词 divides 定义 如 下 : 
1 #x>0,y>0, H y Æx HAF 
0 其 他 
当 x 可 以 被 y 整 除 时 ,谓词 divides WA. 通常 情况 下 , 零 被 认为 不 可 以 整除 任何 数 的 。 在 表 13-3 对 di- 
vides 的 定义 中 , 它 和 sg(x) 相 乘 确 保 了 这 个 条 件 。 剩 下 的 函数 保证 了 divides( x,0) =0。 


| 表 13-3 原始 递归 除 函 数 


ques) =| 


divides(x,y) = { 





描 述 Eg 数 定 义 
求 商 quo(x,y) se(y) + wel at (21) + y,x)] 
求 余 rem(x ,y) x-(y * quo(x,y)) 
整除 divides( x,y) eq( rem(x,y) ,0) + sg(x) 
整除 数 个 数 ndivisors(s,y) y» divides( x ,i) 

i=0 
素数 prime( x) eq( ndivisors( x) ,2) 





泛 化 的 有 界 和 可 以 用 来 计算 一 个 数 所 拥有 的 整除 数 的 个 数 。 和 的 上 界 是 通过 原始 递归 函数 p( 操 
作 输 入 得 到 的 。 这 个 边界 是 可 以 满足 的 ， 因 为 没有 一 个 大 于 x 的 数 可 以 作为 x 的 整除 数 。 素 数 是 仅 能 
被 1 和 它 自身 整除 数 的 数 。 谓 词 prime 仅仅 检查 数 的 整除 数 的 个 数 是 否 为 2。 
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谓词 prime 和 有 界 最 小 化 可 以 用 来 构造 原始 递归 函数 pn， 从 而 可 以 将 这 些 素数 枚 举 出 来 。pn(i) . 


的 值 是 第 i 个 素数 。 因 此 ，pn(0) =2,pn(1) =3,pn(2) =5,pn(3) =7,…。 这 里 第 x+1 个 素数 是 大 于 
pn(x) 的 第 一 个 素数 。 有 界 最 小 化 比较 适合 执行 这 类 查询 。 为 了 使 用 jx 操作 符 ， 我 们 必须 为 最 小 化 确 
定 上 界 。 利 用 定理 13. 3.4， 这 个 界限 可 以 使 用 输入 x 计算 得 到 。 

引 理 13.4.1 ik pn (x) 的 值 是 第 i 个 素数 ， 那么 pn(x+1) &pn(x)! +1, 

WEBB: 对 于 i=0,1,…,x 的 每 个 素数 pn(i) 均 能 够 整除 pn(x)1!。 既 然 一 个 素数 不 会 被 连续 的 两 个 
数 整 除 ， 所 以 要 么 pn (x)! +1 是 素数 ,要么 使 用 素数 进行 分 解 包 含 了 pn(0) ,pn(1) ,- ae 
的 素数 。 无 论 哪 种 情况 ,pn(x+1)<pn(x)! +1, 

上 面 的 引 理 提供 的 边界 可 以 通过 原始 递归 函数 fact(x) +1 来 计算 。 求 第 x aie 
如 下 的 原始 递归 得 到 的 : 

pn(0) =2 


pn(x+1) = eee ua [prime(z) + gt(z,pn(x)) ]. 


我 们 可 以 映射 一 下 原始 递归 函数 家 族 和 图 灵 可 计算 性 之 间 的 关系 。 根 据 定 理 13. 1. 3， 每 个 原始 递 
归 函 数 都 是 图 灵 可 计算 的 。 设 计 能 够 执行 pn 和 ndivisors 这 样 函 数 的 图 灵机 需要 很 多 的 状态 和 复杂 的 
转换 函数 ， 而 使 用 宏观 的 方法 来 看 计算 的 问题 就 可 以 很 容易 地 证 明 这 些 函 数 是 可 计算 的 。 借 助 于 此 ， 
不 需要 构造 复杂 的 图 灵机 ， 我 们 已 经 证 明了 很 多 有 用 的 函数 和 谓词 都 是 图 灵 可 计算 的 。 


13.5 歌德 尔 数 字 和 串 值 递归 


很 多 涉及 自然 数 的 通用 计算 函数 都 不 是 数论 函数 。 例 如 将 一 个 序列 的 数 进 行 排序 的 函数 可 以 返回 
一 个 有 序 的 序列 ， 而 不 是 单个 的 数 。 高 效 的 排序 方法 有 很 多 。 在 这 里 我 们 可 以 通过 引入 原始 递归 操作 
来 完成 类 似 的 操作 。 操 作 的 核心 是 将 序列 中 的 数 编码 为 单个 的 值 。 编 码 的 机 制 将 自然 数 惟一 地 分 解 为 
一 系列 素数 的 乘积 。 这 种 编码 被 称 为 歌德 尔 (Godel) 数字 ， 这 是 根据 发 明 这 项 技术 的 德国 逻辑 学 家 
Kurt Gódel 来 命名 的 。 

n A> BARI x, x, ，,…,x,_1 的 序列 可 以 被 编码 为 

pn(0)**! pn(1)**! ehhh pn(n)**! 225.32... pn(n)**!, 
因为 这 组 数 计数 从 0 FPR, IRAP n 个 元 素 就 被 编号 为 0,1,…,n -1。 使 用 歌德 尔 数字 表示 的 
序列 有 : 经 过 编码 的 长 度 为 n 的 序列 是 最 小 的 nn 个 素数 的 宕 指数 乘积 。 一 一 一 一 


在 指数 上 我 们 使 用 的 是 x +1， 这 样 可 以 保证 即使 在 x, 为 零 的 时 候 ， T "n 

pn(i) 也 会 在 编码 中 出 现 。 i 2 3 -108 
能 够 完成 将 固定 数目 的 输入 进行 编码 的 函数 可 以 直接 从 歌德 尔 数 字 0,1,3 2'355* = 11250 

的 定义 中 推导 出 来 ,我 们 设 : 0,1,0,1 2!3?5!7? -4410 


gn, (x, ,77,x,) 2pn(0)**! + ++ + pn(n)**! = II pn(i)**! 


是 能 够 对 具有 n+1 个 变量 ,x ,…,x, 的 序列 进行 编码 的 函数 。 函数 gn,-1 可 以 用 来 对 有 序 的 n 元 组 进 
行 编码 。 和 有 序 对 [zx ,x ] 对 应 的 歌德 尔 数字 是 gn, (Xo ,Xi ) o 

一 个 解码 函数 可 以 用 来 从 编码 序列 中 取出 相应 的 数据 。 函 数 

dec(i,x) =z cosg( divides(x,pn(i)**'))]+1 

返回 在 歌德 尔 数字 x 中 的 第 i 个 编码 元 素 。 有 界 操作 符 可 以 用 来 在 x 的 素数 分 解 中 查找 pn Ci) 的 指 
数 。 这 个 最 小 化 操作 返回 的 是 第 一 个 不 能 使 pn C) 整除 x 的 z。 编 码 序列 中 的 第 i 个 元 素 比 编码 中 
pn(i) 的 指数 小 一 。 对 于 每 个 不 在 x 的 素数 分 解 中 出 现 的 pn(i) ， 解码 函数 dec(i,x) 返 回 的 是 0。 

当 计 算 需 要 得 到 前 面 的 n 个 数字 时 ， 那 么 可 以 利用 歌德 尔 编码 函数 gn ,对 这 些 值 进行 编码 。 当 
需要 的 时 候 ， 编 码 的 值 可 以 从 序列 中 检索 出 来 。 

例 13.5.1 324432 (Fibonacci) 数列 定义 为 如 下 的 序列 : 0,1,1,2,3,5,8,13…， 这 里 面 每 个 元 
素 都 是 前 面 两 个 元 素 的 和 。 函 数 
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f(0) =0 
f(1) 21 
f(y +1) =f(y) +f(y -1) HF y > 1 
AY LAPS AE SER BO, 3X RO RE SCOTIAE BS, DNO f(y +1) AA T. fO) ALG - 1) 
为 了 表明 斐 波 纳 契 数列 可 以 利用 原始 递归 函数 来 生成 ,我们 可 以 利用 歌德 尔 数字 来 将 两 个 值 存储 为 
gn1， 并 可 以 使 用 额外 的 函数 hh 来 对 有 序 对 中 的 f(y -1) 和 f(y) 进 行 编码 : 
h(0) 2 gn, (0,1) =2'3? =18 
h(y +1) 2 gn (dec(1,h(y)) ,dec(0,h(y)) * dec(1,h(y))). 
h 的 初始 值 是 编码 的 [f(0) FC) ]; h (y 1). 的 计算 从 生成 下 面 的 有 序 对 开始 
[dec(1,h(y)) ,dec(0,h(y) ) * dec(1,h(y)) ] =[fly) fy -1) +f(y)]. 
使 用 gn, 来 对 结果 进行 编码 就 完成 了 对 h (y +1) 的 计算 。 这 个 过 程 会 构造 [f(0),f(1)],[f(1)， 
2), LQ2) ,f(3)]，… 等 有 序 对 序列 的 歌德 尔 数 字 。 原 始 递 归 函 数 f(y) = dec(0,h(y) ) 能 够 从 有 序 
对 的 第 一 部 分 中 提取 出 斐 波 纳 契 数列 。 口 
歌德 尔 数字 编码 函数 on, 可 以 对 固定 数目 的 参数 进行 编码 。 同 样 ， 也 可 以 构造 出 参数 个 数 是 由 计 
算 而 得 的 歌德 尔 数字 编码 函数 。 具 体 的 构造 方法 与 构造 计算 有 界 和 以 及 有 界 乘 积 的 操作 类 似 。 对 于 只 
有 一 个 变量 的 原始 递归 函数 1， 可 以 根据 它 的 输入 0,1,…,n 定义 一 个 长 度 为 n+1 的 序列 f(0) ,f(1) ,…， 
f(n)。 使 用 有 界 积 ， 歌 德尔 数字 编码 函数 


gníGn ho ye D mco? 
iz0 


可 以 对 f 的 前 y+1 个 值 进行 编码 。 函 数 f 和 编码 函数 on, 之 间 的 关系 将 在 定理 13. 5. 1 中 给 出 。 

定理 13.5.1 设 f 是 有 n+1 个 变量 的 函数 ， 编码 函数 en, 根据 来 定义 。 那 么 f 是 原始 递归 的 当 
且 仅 当 gn, 是 原始 递归 的 。 

证 明 : WR f(x, ,…,x,,y) 是 原始 递归 的 ， 那么 有 界 积 


y 
BN (Wy y) E I] pn (1/7 Xni) +1 
i=0 


能 够 产生 歌德 尔 数字 编码 函数 。 在 另 一 方面 ,解码 函数 可 以 用 来 从 歌德 尔 数字 编码 中 恢复 了 的 数值 。 
Fx, XY) =dec(y, gn (x,y) ). 
因此 , f 是 原始 递归 的 当 且 仅 当 gn 是 原始 递归 的 。 "m 
正 是 考虑 到 原始 递归 函数 具有 直观 可 计算 性 ， 我 们 才 引 入 了 这 个 概念 。 在 原始 递归 的 定义 中 , 我 

们 允许 利用 递归 变量 前 面 的 计算 结果 来 执行 当前 的 计算 。 对 于 下 面 的 函数 : | 

f(0) =1 : 

fA) 2f(0) 1=1 

f(2) =f(0) + 2«f(1) «123 

f(3) (0) -3«f(1) -2«4f(2) +1=8 

FCA) 2f(0) - 4 «f(1) 3 +f(2) 24f(3) ^ 1221 


函数 了 可 以 表示 为 
f(0) =1 


fot) = 9 fi) (y+17i), 


给 出 的 定义 并 不 是 原始 递归 的 ， 因 为 有 y+1) 的 计算 使 用 了 前 面 所 有 的 计算 结果 。 但 是 ， 这 个 函数 直 
观 上 却 是 可 计算 的 ， 因 为 函数 定义 本 身 给 出 了 如 何 执行 计算 的 算法 。 

当 递归 变量 y+1 对 应 的 值 是 根据 0) ,f(1) ,…,f(y) 而 定义 的 时 候 ， 我 们 称 函数 了 是 串 值 递归 定 
义 的 。 对 于 使 用 串 值 递归 定义 的 函数 来 说 ， 当 计算 函数 值 的 时 候 往往 需要 使 用 递归 变量 中 的 每 个 输入 
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值 。 在 前 面 的 例子 中 , A ee BE (0) A f(C1) , TT f(4) ATA BEA), f(1) , f(2) A F(3) s 
单个 函数 无 法 直接 从 前 面 的 值 来 计算 f(2) 和 f(4) ， 因 为 一 个 函数 要 求 参数 的 个 数 是 固定 的 。 
无 论 递 归 变 量 y+1 的 值 是 多 少 ， 前 面 的 结果 均 可 以 使 用 歌德 尔 数字 编码 函数 来 进行 编码 。 这 一 
点 为 给 串 值 递归 进行 形式 化 的 定义 提供 了 基础 。 
定义 13.5.2 设 g 和 有 分 别 是 n+2 个 变量 的 数论 全 函数 。 具 有 n+l 个 交 量 的 函数 定义 如 下 : 
i) f(x, 9 Xp ,0) = g(x, Pare N, 
3) Jur xU FL) SAN rues an (x vox ) 
这 个 函数 被 称 为 从 8g Fo h Fi) RT AGE 3E 9a 13 8] o 
定理 13.5.3. 如 果 具 有 n+1l 个 变量 的 函数 1 是 由 原始 递归 函数 g fo h Fl Mit GE iB 98 HFS OH, 
那么 f 也 是 原始 递归 的 。 
证 明 : 我 们 从 原始 递归 函数 g Al h FP OR KEM gno 
A D) aate 
= gsm) +1 


SxQy-1)4l 


gnyCx, ,7,x,,y *1) 2gnj(x,,7,x,,) * pn(y 1) 7 
ze uoa pn ye Da tamtn 

对 于 gní(x, 77, x,,y £1 MHA, 我们 使 用 了 : 

i) BR x,,-,x,, 

i) 递归 变量 的 前 一 个 值 y， 

ii) gn, 的 前 三 个 值 By)5 

iv) 原始 递归 未 数 六 pn, +, + 和 指数 函数 。 
AC, gn 的 计算 是 原始 递归 的 。 根 据 定理 13. 5. 1， 我 们 可 以 得 出 /是 原始 递归 的 。 图 

从 机 器 的 角度 来 看 ， 歌 德尔 数字 编码 函数 可 以 使 得 计算 拥有 不 受 限制 的 记忆 存储 能 力 。 单 个 的 歌 
德尔 数字 编码 可 以 存储 前 面 任何 结 果 的 值 。 歌 德尔 数字 可 以 对 计算 x6,… ,x ,y+1) 所 需 的 f(%,…， 
x,,0) f(x x, 1) 和 fo,…,x,,y) 都 进行 编码 。 解 码 函 数 则 在 记忆 和 计算 之 间 提 供 了 联系 。 当 需要 
使 用 存储 的 值 来 进行 计算 时 ,解码 函数 能 够 满足 需求 。 

例 13.5.2 设 h 是 原始 递归 函数 


h(x,y) = F dec(i,y) * (x+1 -i). 


那么 在 前 面 计 值 计算 中 定义 的 函数 /可 以 在 h 上 进行 计 值 过 程 递归 来 定义 。 
f(0) =1 


Hy +1) ehGsenG)) = Ý, decimo) + (r+ =i) 
= DM) + 41-8 口 


13.6 可 计算 部 分 函数 


原始 递归 函数 是 指 直觉 上 可 计算 的 函数 家 族 。 我 们 已 经 证 明了 所 有 原始 递归 函数 都 是 全 函数 。 相 
应 地 ， 是 不 是 所 有 的 可 计算 的 全 函数 都 是 原始 递归 的 呢 ? 而 且 ， 我 们 是 否 应 该 将 对 可 计算 性 的 分 析 限 
制 到 全 函数 的 范畴 上 呢 ? 在 本 节 中 ， 我 们 将 对 这 两 个 问题 给 出 否定 的 证 明 。 

我 们 将 使 用 对 角 化 的 证 明 方法 来 说 明 存在 一 个 可 计算 的 全 函数 ， 而 它 却 不 是 原始 递归 的 。 第 一 步 
是 证 明 原始 递归 函数 的 语法 结构 允许 对 它们 进行 有 效 地 枚 举 。 而 且 ， 可 以 将 原始 递归 函数 列举 出 来 ， 
又 使 得 我 们 可 以 构造 出 与 列表 中 存在 的 所 有 函数 均 不 同 的 新 函数 。 

定理 13.6.1 原始 递归 函数 的 集合 是 可 以 有 效 计算 的 数论 函数 集合 的 真子 集 。 

WEBB: 原始 递归 函数 可 以 表示 为 字母 表 = |s,p,z;0,1,2,3,4,5,6,7,8,9,(,) ,0,;,(,)1 上 的 字 


288 RERA i 





[410] FR, AERA s Mp RRA (s), (2) Al (pi (j))。 组 合 函数 ho (8 ,…,g,) 可 以 被 表示 为 





《《h>o《《(g1),…,《g8,)))， 这 里 的 《h) 和 “【〈g;〉 都 是 成 分 函数 的 表示 。 利用 g 和 有 h 使 用 原始 递归 得 
到 的 苑 数 表示 为 (《g):(h))。 

在 “中 的 字符 串 可 以 按照 长 度 来 依次 生成 : 首先 是 空 串 ， 然 后 是 长 度 为 1 的 字符 串 ， 接 下 来 是 
长 度 为 2 的 字符 串 ， 依 此 类 推 。 我 们 可 以 很 直观 地 设计 一 个 机 械 的 过 程 来 判断 字符 串 是 否 代表 了 一 个 
原始 递归 函数 。 通 过 重复 地 生成 字符 串 并 判断 它 是 否 是 一 个 函数 语法 的 正确 表示 ， 便 可 以 完成 对 原始 
递归 函数 的 枚 举 。 第 一 个 满足 条 件 的 字符 串 可 以 表示 为 及 ， 第 二 个 表示 为 /;/ ， 依 此 类 推 。 基 于 同样 的 
方式 ， 我 们 可 以 枚 举 出 所 有 只 拥有 一 个 变量 的 原始 递归 函数 。 这 一 点 可 以 通过 在 先前 生成 的 列表 中 删 
除 所 有 参数 个 数 大 于 1 的 函数 来 完成 。 因 此 ， 可 以 将 序列 表示 为 : A? AP LO s 

拥有 一 个 变量 的 全 函数 

g(i) =f; (i) +1 

是 可 计算 的 。 因 为 可 以 将 所 有 拥有 一 个 变量 的 原始 递归 函数 枚 举 出 来 ， 由 此 便 可 得 出 g 的 可 计算 性 。 
8(Ci) 的 值 可 以 通过 下 面 的 步骤 得 到 : 

i) 确定 第 i 个 拥有 一 个 变量 的 原始 递归 函数 /"， 

i) HAL? (i) IFA 

ii) 将 fn (i) M—. 
因为 每 一 步 都 是 可 计算 的 ， 所 以 我 们 总 结 得 出 g 是 可 计算 的 。 根 据 对 角 化 证 明 原 理 ， 对 于 任意 i, 

g(i) fi? (i) 

因此 ，8 是 可 计算 的 全 函数 ， 但 却 不 是 原始 递归 的 。 

定理 13. 6. 1 使 用 对 角 化 方法 证 明了 存在 可 计算 但 却 不 是 原始 递归 的 函数 。 这 一 
接 构造 可 计算 而 不 是 原始 递归 的 函数 来 完成 。 有 两 个 变量 的 数论 函数 ， 通 常 被 称 为 阿 克 曼 函数 
(ackermann's function) ， 就 是 这 样 一 个 函数 ， 它 的 定义 如 下 : 

i) A(0,y) =y+1 

ii) A(x+1,0) 2 A(x,1) 

ii) A(x*1,y * 1) =A(x,A(x+1,y)) 
阿 克 曼 函数 的 值 是 递归 定义 的 ， 它 的 基础 是 等 式 〈i) 。 通 过 在 x 上 的 推导 ， 可 以 知道 对 于 每 一 对 输入 
的 值 ， 它 的 结果 是 惟一 的 〈 留 作 练习 22) 。 例 13.6. 1 中 的 计算 证 明了 阿 克 曼 函数 的 可 计算 性 。 

例 13.6.1 4(1,1) 和 4(3,0) 的 值 可 以 从 阿 克 曼 函数 的 定义 得 到 。 下 面 右 侧 的 列 给 出 了 替换 的 
步骤 ; 


a) A(1,1) =4(0,4(1,0) ) (iii) 
-A (0, A (0, 1)) (ii) 
-A (0, 2) (i) 
=3 
b) A(2,1) =A(1,A(2,0) ) (iii) 
=A(1,A(1,1)) (ii) 
=A(1,3) (a) 
=A(0,A(1,2)) (iii) 
=A(0,A(0,A(1,1))) (iii) 
=4(0,4(0,3) ) (a) 
-A(0,4) (i) 
25 (i) o 


Pul v2.58 PRIA TELE AS tH TARRY ERE. FEB SES RS a, BAHEA — A 
变量 的 函数 : 
A(1,y) =y+2 
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A(2,y) 22y +3 

A(3,y) 22"? -3 

A(4,y) 222^ =3. 
在 A(4,y) 中 ,指数 链 上 2 的 个 数 是 y。 例 如 ,4(4,0) 216 -3,A(4,1) =2" -3 MH. A(4,2) 2255 -3, 
阿 克 曼 函数 中 的 第 一 个 变量 决定 了 函数 值 增长 的 速度 。 下 面 我 们 将 介绍 关于 阿 克 曼 函数 和 原始 递归 函 
数 增长 速度 比较 的 定理 。 在 这 里 我 们 不 给 出 定理 的 证 明 过 程 。 

定理 13.6.2. 对 于 每 个 只 有 一 个 变量 的 原始 递归 函数 J/， 存 在 ieN 使 得 f(i) <A(i,i)。 

很 明显 ， 单 个 变量 的 函数 A(i, 让 不 是 原始 递归 的 。 这 也 就 意味 着 阿 克 曼 函数 不 是 原始 递归 的 。 假 
设 它 是 的 话 ， 那 么 可 以 通过 A。(pi pO ) 得 到 A(i,i)， 若 如 此 ， 则 4(i, 让 也 将 是 原始 递归 的 。 

是 不 是 可 以 在 原始 递归 函数 的 集合 中 增加 一 些 基 本 函数 或 者 是 额外 的 操作 ， 可 以 使 它 包含 所 有 的 
可 计算 全 函数 ? 不 幸 地 是 ， 答 案 是 否定 的 。 无 论 全 函数 集合 是 否 是 可 计算 的 ， 定 理 13.6. 1 中 的 对 角 
线 证 明 表 明了 我 们 无 法 将 所 有 可 计算 的 全 函数 枚 举 出 来 。 因 此 ， 我 们 可 以 总 结 得 出 可 计算 函数 是 无 法 
有 效 产生 的 ， 或 者 是 存在 可 计算 的 非 全 函数 。 如 果 我 们 接受 了 后 面 的 结论 ， 那 么 在 对 角 线 证 明 中 出 现 
的 矛盾 就 会 消失 。 我 们 不 接受 g 是 f PH- RERA gi) Af (i)o ns OT, WA gli) = 
fi? (i) +1 同 样 是 没有 定义 的 。 如 果 我 们 希望 能 够 有 效 地 枚 举 所 有 的 可 计算 函数 ， 那 就 应 该 在 枚 举 中 包 
含 部 分 函数 。 

接 下 来 我 们 考虑 部 分 函数 的 可 计算 性 。 因 为 组 合 和 原始 递归 可 以 保持 全 函数 的 性 质 ， 所 以 需要 增 
加 额外 的 操作 符号 ， 从 而 能 够 从 基本 函数 产生 部 分 函数 。 最 小 化 操作 可 以 被 形式 化 地 描述 为 查询 过 
T: 在 要 检查 的 自然 数 上 设 定 一 个 界限 ， 可 以 保证 有 界 最 小 化 操作 产生 的 是 全 函数 。 无 界 最 小 化 可 以 
通过 在 查询 的 时 候 ， 不 在 自然 数 上 设置 上 界 来 实现 。 函 数 

f(x) =pzLeq(x;z +z) ] 
定义 了 无 界 最 小 化 操作 。 当 x 的 平方 根 是 整数 的 时 候 ， 无 界 最 小 化 返回 它 的 平方 根 。 否 则 ， 查 询 一 直 
寻找 第 一 个 满足 条 件 的 整数 ， 直 到 无 穷 大 。 虽 然 eg 是 全 函数 , 但 函数 f 却 不 是 ， 例 如 f(3) T o 如 果 对 
于 输入 x 的 查询 没 能 返回 值 ， 那 么 利用 无 界 最 小 化 定义 的 函数 对 于 x 就 是 没有 定义 的 。 

随 着 部 分 函数 的 引入 ， 我 们 不 得 不 重新 检查 组 合 和 原始 递归 操作 。 在 定义 组 合 的 时 候 ， 需 要 考虑 
输入 没有 定义 的 可 能 性 。 对 于 输入 x ,… ,x， 如 果 下 列 的 条 件 中 有 一 个 为 真 ， 那么 函数 ho (gig) 
便 是 无 定义 的 : 

i) 对 于 某 个 1s«isn,g,(x, ,-* SX) 1 ,或 者 

i) 对 于 所 有 的 1 &isn,g,(x, ,7**,x,) { ,并且 有 $989, 9555,31) id 
任何 在 g, 上 没有 定义 的 值 都 会 传播 到 组 合 函 数 中 。 

原始 递归 操作 需要 参与 定义 的 函数 和 8 都 是 全 函数 。 这 里 可 以 将 原始 递归 的 限制 放宽 ， 人 允许 使 
用 部 分 函数 。f 是 通过 对 部 分 函数 g 和 hh 进行 原子 递归 操作 来 定义 的 。 

f(x, epee sO) = a(x, jt, XT) 

fn 7x, +1) Hh 13,38 Gn 21310999) 
使 用 原始 递归 的 定义 计算 函数 值 是 一 个 迭代 的 过 程 。 对 于 函数 A, A y 的 值 仅 当 于 列 条 件 满 足 
的 时 候 才 有 定义 : 

i) f(x,,77,x,,0) 1,0 g(x, ix) d 

ii) Vxor ux, Jy HED 1 , WAXPTOxizyf(x Ge ED UT) l ,并 且 h(x, path x YS fox] $t. Xy, 
»)1. 
递归 变量 未 定义 的 值 使 得 了 对 于 相应 的 递归 变量 后 所 有 的 值 都 没有 定义 。 

利用 部 分 函数 定义 中 的 协定 ， 可 以 使 用 组 合 - 原 始 递 忆 和 无 界 最 小 化 操作 来 定义 可 计算 部 分 函数 
家 族 。 

定义 13.6.3 见 -递归 函数 (u-recursive function) 家 族 定义 如 下 : 

i) 后 继 函 数 、 零 函数 和 投影 函数 都 是 内- 递归 函数 有 
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ii) 如 果 及 是 一 个 有 nn 个 输入 变量 的 几 -递归 函数 ， 而 8i，,…,8, 是 有 大 个 输入 变量 的 凡 -递归 函数 ， 
ARA f-ho(g,:,2,)€ u-iÉ Ja BK, 

ii) WR g 和 有 分 别 是 有 n 和 n+2 个 变量 的 几 -递归 函数 ， 那么 由 8g 和 hh 利用 原始 递归 得 到 的 函 
数 f 也 是 几 - 递 归 函 数 。 

iv) Jw p(xi,…,%,y) 是 一 个 凡 递 归 的 全 谓词 ， 那 么 f=1z[p(xi，…,X,,z) ] X u- if Ja BH, 

V) 如 果 一 个 函数 可 以 从 条 件 (i) 中 的 函数 出 发 、 通 过 有 限 次 使 用 (ii)( 秆 ) (iv) 中 的 规则 得 到 ， 那 
A+ dE LIE u- 3$ Jag AC s 

AKT Ci) fil Cii) (过 ) 意 味 着 所 有 的 原始 递归 函数 都 是 pw- 递 归 函 数 。 注 意 定 义 中 无 界 最 小 化 并 不 是 

对 于 所 有 的 谓词 都 有 定义 的 ， 而 只 是 对 -递归 的 全 谓词 有 定义 。 
图 灵机 中 可 计算 性 的 含义 自然 包含 了 部 分 函数 。 图 灵机 能 够 计算 一 个 部 分 的 数论 函数 J， 如 果 f 
满足 : 
i) MfG sux) LB, 计算 以 ，… 如) 为 结果 停机 ; 

ii) 34f(x,,-,x,) 1 时， 计算 不 停机 。 

当 结 果 存在 时 ， 图 灵机 总 会 计算 出 函数 的 值 。 否 则 ， 计 算 会 无 限 地 进行 下 去 。 

接 下 来 我 们 将 在 人 -递归 函数 和 图 灵 可 计算 函数 之 间 建 立 联系 。 过 程 的 第 一 步 是 表明 所 有 从 =- 递归 
函数 都 是 图 灵 可 计算 的 ， 这 一 点 并 不 让 人 吃惊 ， 因 为 这 仅仅 是 将 定理 13.1.3 中 的 结论 进行 了 延伸 。 

定理 13. 6.4 每 个 几 -递归 函数 都 是 图 灵 可 计算 的 。 

证 明 : 因为 基本 函数 都 是 图 灵 可 计算 的 ， 所 以 只 需要 表明 图 灵 可 计算 的 部 分 函数 在 组 合 、 原 始 递 
归 和 无 界 最 小 化 操作 下 是 闭合 的 就 可 以 了 。 在 定理 9.4.3 和 定理 13. 1.3 中 ,我 们 已 经 证 明了 图 灵 可 计 
算 的 全 函数 在 组 合 、 原 始 递归 下 面 都 是 闭合 的 。 这 些 操作 同样 也 为 部 分 函数 构造 了 闭 包 。 在 计算 过 程 
中 ,在 函数 某 一 成 分 计算 过 程 中 出 现 的 未 定义 值 将 会 使 整个 计算 无 限制 的 进行 下 去 。 

下 面 只 需要 证 明 图 灵 可 计算 的 全 谓词 在 无 界 最 小 化 操作 下 是 图 灵 可 计算 的 即 可 。 设 F(x, + x,) = 
pel ps ,7y)]， 这 里 PCx ，,…,x,,y) 是 图 灵 可 计算 的 全 谓词 。 计 算 f 的 图 灵机 可 以 根据 执行 谓词 p 
的 图 灵机 P 进行 构造 ， 带 上 最 初 的 配置 是 Bx,Bx,B…Bx,B。 

1. 将 对 数字 零 的 表示 添加 到 输入 的 右 侧 。 最 小 化 操作 符 要 进行 的 查询 从 下 面 的 带 上 配置 开始 : 

B x,B x,B---Bx,BOB. 
输入 右 侧 的 数字 ， 称 为 j， 是 最 小 化 操作 符 的 索引 。 
2. 制造 一 份 参数 和 j 的 工作 拷贝 ， 从 而 在 带 上 产生 配置 
Bx,Bx,B--Bx,BjB x, Bx,B--:B x,B jB: 
3. 利用 图 灵机 P 来 运行 包含 参数 和 j 拷 贝 的 输入 。 在 带 上 产生 
Bx,Bx,B--Bx,BjB p(x, ,x,,-,x,,J) B. 
4. WAR p(x 25,7 And) 21, IBA p RAMEN RE j. 否则 将 pO 25 .ix uU) BEER, 增加 
j， 重 复 步骤 2 中 的 计算 。 
当 出 现 第 一 个 使 p(x x, ,,x,,) =1 的 j 的 时 候 ， 计算 在 第 4 步 停 机 。 如 果 这 样 的 值 不 存在 ， 那 么 计 
算 就 会 无 限 地 循环 下 去 ， 表 明 此 时 f 是 没有 定义 的 。 m 


13.7 图 灵 可 计算 函数 和 Mu = 递归 函数 


我 们 已 经 证 明了 所 有 的 人 -递归 函数 都 是 图 灵 可 计算 的 。 现 在 我 们 把 精力 转换 到 与 之 相对 的 结论 
上 来 ， 即 每 个 图 灵 可 计算 函数 都 是 -递归 函数 。 为 了 证 明 这 一 点 ,我 们 需要 设计 一 个 数论 函数 来 模 
拟 图 灵机 的 计算 。 为 了 构造 这 个 模拟 函数 ， 我 们 需要 完成 从 图 灵机 的 领域 到 自然 数 领域 的 迁移 。 我 们 
把 从 图 灵机 计算 到 函数 的 转换 称 为 图 灵机 的 代数 化 ( arithmetization) 。 

代数 化 首先 为 图 灵机 的 配置 贼 鼎 一 个 值 , 设 M=1Q, 忆 ,了 ,6,qo ,4 计 是 可 以 计算 一 个 变量 的 数论 函 
数 f 的 标准 图 灵机 。 我 们 将 构造 一 个 多 -递归 函数 来 数字 化 地 模拟 M. 的 计算 过 程 。 这 个 构造 过 程 可 以 
很 容易 地 泛 化 到 具有 多 个 变量 的 函数 上 。 

图 灵机 M 的 配置 包含 了 状态 、 带 头 的 位 置 以 及 从 带 的 左边 界 到 最 右边 非 空白 的 符号 之 间 的 符号 。 
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所 有 的 这 些 成 分 都 要 被 表示 为 一 个 自然 数 ,我们 将 用 如 下 的 方式 来 表示 状态 和 带 上 的 字母 类; 

Q=|g ,91,.…q;| 

Bis Aa Ta, 
数字 将 通过 下 标 来 获取 ， 带 上 的 符号 B 和 了 分 别 被 表示 为 0 和 1。 带 头 的 位 置 可 以 使 用 带 上 的 位 置 来 
表示 。 

带 上 最 右边 的 非 空白 符号 结束 了 定义 在 "上 的 字符 串 。 我 们 使 用 
字母 表 中 元 素 的 数字 表示 形式 来 对 带 进行 编码 ， 使 用 歌德 尔 数字 编码 来 
对 与 序列 isi ,… ,i, 对 应 的 字符 串 a.a, a; 进行 编码 。 代 表 非 空 带 段 的 
数字 称 为 带 数字 (tape number) 。 

右 图 中 对 应 的 机 器 格局 中 非 空 片段 的 带 数 字 是 2'3”5” 2450 对 第 三 个 
空白 位 置 进行 显 式 地 编码 将 会 得 到 2/3757! =3150， 这 是 另外 一 个 表示 
带 的 带 数 字 。 在 带 的 最 右 非 空格 的 右边 ， 任 意 数目 的 空格 都 可 以 引入 到 
带 数 字 上 。 

使 用 数字 0 表示 空白 允许 我 们 对 任意 的 带 位 置 进行 编码 ， 而 无 需 考 
虑 在 带 数 字 中 编码 的 带 段 。 如 果 dec(i,z) 20, MH pn(i) 能 够 整除 z， 那 么 空白 就 可 以 编码 到 带 数 字 z 
中 。 男 一 方面 ， 如 果 dec(i,z) =0， 而 pn( 站 不 能 够 整除 z， 那 么 位 置 i 应 该 出 现在 带 上 编码 段 的 右边 。 [416 
因为 带 数字 编码 了 整个 非 空 白带 上 的 段 ， 那么 位 置 i 必然 是 空白 。 

图 灵机 的 配置 是 由 状态 数 、 带 头 位 置 以 及 带 数 字 来 确定 的 。 配 置 数 字 将 这 些 数字 整合 为 一 个 
数字 。 





an, (状态 数 ， 带 头 位 置 ， 带 数字 ) 
这 里 gn, 是 能 够 对 有 序 三 元 组 进行 歌德 尔 数字 编码 的 函数 。 
例 13.7.1 图 灵机 S 完成 的 是 后 继 函数 。 ES nd 
对 于 计算 中 产生 的 每 个 配置 都 会 给 出 对 应 的 配置 数 a EA 
字 。 这 里 需要 注意 带 上 的 符号 3 和 7 分 别 用 数字 0 和 1 来 ，sS。 Sq) BBR Nay BAL 


表示 。 


状 态 位 E 带 数 字 配置 数字 
qoBI1B 0 0 2!3?5? =450 gn; (0,0,450) 
| Bq,11B 1 1 213757 =450 gn, (1,1,450) 
| B1q11B 1 2 213?5? -450 gn; (1,2,450) 
| Bllq,B 1 3 2132527! 23150 gn; (1,3,3150) 
| BIq11B 2 2 21325272111 2242550 gn; (2,2,242550) 
上 Bg,111B 2 1 21325272111 =242550 gm (2,1,242550) 
| qBII1B 2 0 2132527711! 242550 gm (2.,0,242550) O 


标准 图 灵机 中 的 转移 不 需要 改变 带 或 者 状态 ,但 是 必需 移动 带头 。 带 头 位 置 的 变化 和 歌德 尔 数字 
编码 的 惟一 性 保证 了 在 一 个 计算 中 两 个 连续 的 配置 数 必 然 是 不 同 的 。 

我 们 还 可 以 构造 函数 tr, 来 追踪 图 灵机 M. 的 计算 过 程 。 追 踪 计算 的 过 程 意味 着 需要 产生 配置 数 序 
列 , 这 个 序列 对 应 函数 计算 过 程 中 产生 的 配置 序列 strw (x, 让 的 值 是 当 M 处 理 输入 x 的 时 候 ， 经 过 i 
次 转换 得 到 的 配置 数 。 因 为 M 的 初始 配置 是 quBxB, TJ 


x41 


try (x,0) =gn,(0,0,2' - II pn(i)). 


tru(x,y+1) 的 值 是 通过 操作 配置 数 rw(x;7) 从 而 构造 接 下 来 的 机 器 配置 而 得 到 的 。 
状态 和 带头 所 指 的 位 置 上 的 符号 决定 了 在 图 灵机 M 上 要 使 用 的 转换 。 原 始 递 归 函 数 
cs(z) 2 dec(0,z) 
ctp(z) =dec(1,z) 
cts(z) 7 dec( ctp(z) ,dec(2,z) ) 


oo 
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返回 状态 号 、 带 头 的 位 置 和 在 配置 数 z 下 带头 所 指 的 符号 数 。 带 头 的 位 置 是 直接 通过 对 配置 数 进行 解 
码 得 到 的 。 带 头 所 指 符号 的 数字 表示 被 编码 为 带 数 字 里 面 的 第 c 如 (z) 个 元 素 。cs、c 如 和 cts 里 面 的 c 
代表 了 当前 配置 中 的 部 分 : 当前 状态 、 当 前 带头 位 置 以 及 当前 带 上 的 符号 。 
转换 归 约 了 如 何 对 机 器 进行 配置 ， 也 就 是 相应 的 配置 号 如 何 进行 改变 。 在 M 中 转换 可 以 表示 为 
8(q,,b) 2 [q,,c,d], 

这 里 的 q;, 4, e Q;b,c eT 并 且 de |R,L|。 通 过 定义 函数 来 模拟 M 中 转换 的 效果 。 我 们 首先 列 出 了 M 
中 的 转换 : 

8(q, bo) = Ca, seo ;d,] 

6(g; ,b1) = [ qj, ,6,d, | 


Sl qi bm) = v dis d. 

图 灵机 的 确定 性 保证 了 转换 的 参数 都 是 不 同 的 。 
Jo... WR cs(z) =i FFA cts(z) 2 n(5,) 
ji 如 果 cs(z) =i, FA ets(z) =n(b,) 
ns(z) : 
in 如 果 ics(z) =i, IFA, cts(z) =n(b,,) 
cs(z) 其 他 情况 
它 返回 的 是 在 配置 数 z 下 执行 转换 所 进入 状态 的 状态 号 。 右 边 的 条 件 表示 了 相应 的 转换 。 设 n(b) AE 
表 了 带 上 符号 b 的 数字 ; 那么 ， 第 一 个 条 件 可 以 被 解释 为 “如 果 当 前 状态 号 是 如 ， 而 当前 带 上 的 符号 
是 b,， 那 么 新 的 状态 对 应 的 数字 是 i,”。 这 里 直接 将 原来 的 转换 映射 到 数字 表示 上 来 。M 中 的 每 个 转 
换 都 在 ns 中 定义 了 一 个 条 件 。 最 后 的 条 件 表明 了 如 果 没 有 转换 能 够 匹配 状态 和 输入 符号 ,那么 新 的 
状态 和 当前 状态 是 一 致 的 。 条 件 定义 了 一 组 穷 举 的 而 且 是 相互 独立 的 原始 递归 谓词 。 因 此 ,ns(z) 是 
原始 递归 的 。 计 算 新 的 带 上 符号 数字 的 函数 nts 可 以 用 完全 类 似 的 方式 来 定义 。 

计算 新 的 带头 位 置 的 函数 按照 转换 中 的 规约 来 改变 当前 的 位 置 数 。 转 换 将 方向 定义 为 L( 左 ) 或 者 
R( 右 )。 将 带头 癌 左 移动 将 在 当前 的 位 置 数 上 减 一 ， 而 向 右 移 动 则 是 加 一 。 为 了 将 方向 进行 数字 化 ， 
我 们 使 用 下 面 的 表示 

0 WRd=L 
i 
新 的 带 位 置 函数 可 以 定义 为 : 
ctp(z) +n(d) +1 如果 cs(z) =i, 并且 cfs(z) =n(bo) 
ctp(z) +n(d,) +1 WR es(z) =i, FFA cts(z) =n(b,) 
ntp(z) = ; 

ctp(z) +n(d,,)~1 "WE cs(z) =i, FFA cts(z) =n(b,,) 
ctp(z) 其 他 情况 
n(d,) 一 1 对 于 当前 位 置 号 进行 操作 ， 当 带头 向 左 移动 的 时 候 ， 将 位置 数 减 一 ; 当 带 头 向 右 移 动 的 时 
候 ， 将 位 置 数 加 一 。 

我 们 已 经 差不多 完成 了 对 于 追踪 函数 的 构造 。 给 定 一 个 机 器 的 配置 ， 函 数 ns 和 ntp 能 够 计算 出 新 
配置 中 的 状态 号 和 带头 位 置 。 接 下 来 要 完成 的 就 是 计算 新 的 带 号 。 

转换 将 带头 所 指 的 符号 进行 替换 。 在 我 们 函数 化 的 方法 中 ， 带 头 的 位 置 是 根据 配置 号 z 并 利用 函 
数 ctp 得 到 的 。 将 要 在 带 上 ctp(z) 位 置 写 入 的 符号 用 数字 表示 为 ak(z) 新 的 带 数字 可 以 通过 改变 当 
前 带 数 字 中 pn( cip(z) ) 的 指数 来 获得 。 在 转换 之 前 ， 对 z 进行 分 解 可 以 得 到 pnCetp(z)) "O", EÈ 
ctp(z) 位 置 上 的 当前 符号 的 编码 。 在 转换 之 后 ，ctp(z) 位 置 上 的 符号 表示 为 nis(z)。 原 始 递 归 函 数 

ntn(z) = quo(ctn(z) ,pn(ctp(z) ) ? ** ) - pn(ctp(z))™"® 
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能 够 完成 需要 的 替换 。 通 过 划分 ， 我 们 可 以 从 带 数字 cin(z) 里 面 将 etpCz) 位 置 上 符号 的 编码 移 除 掉 。 
接 下 来 ， 结 果 又 乘 以 pn( ctp(z) )“””， 这 样 就 对 新 的 带 符号 进行 了 编码 。 

追踪 函数 try 是 对 原来 的 函数 进行 原始 递归 而 定义 的 。 这 些 函 数 模拟 了 在 M 上 对 配置 执行 转换 的 
效果 。 如 同 前 面 所 示 ，M 的 当前 状态 为 g ， 带 头 在 位 置 0。 在 带 上 从 1 开始 到 x+1 的 位 置 放置 的 是 计 
算 的 输入 x。 机 器 的 配置 被 编码 为 ; 


x 


trí (x,0) 2 gn,(0,0,2! ， II pn(i)?). 


接 下 来 的 机 器 配置 会 使 用 前 面 的 配置 作为 输入 ， 并 使 用 新 的 状态 、 新 的 带头 位 置 和 新 的 带 数字 来 
获得 。 

try (x,y +1) = gn, (ns(try(x,y) ) ,ntpCtru(x,y) ) ,ntnC try xy) ) )- 
因为 在 try, 中 每 个 函数 都 是 原始 递归 的 ， 所 以 我 们 可 以 总 结 出 来 trw 不 仅 是 多 -递归 的 ， 而 且 是 原始 递 
归 的 。 但是， 追踪 函数 并 不 是 我 们 采用 的 函数 模拟 图 灵机 的 项 点， 它 并 不 返回 计算 的 结果 而 是 返回 配 
置 数 的 序列 。 

图 灵机 M 是 根据 数论 函数 来 进行 计算 的 ， 它 对 于 输入 x 的 结果 可 以 利用 函数 tr 来 模拟 。 我 们 
首先 要 注意 到 M 有 可 能 不 停机 ，f(x) 也 有 可 能 没有 定义 。 关 于 停机 的 问题 ,我 们 可 以 使 用 tru 的 结果 
来 判定 。 如 果 M 为 配置 trw(x,i+1) 声 明了 转换 ， 那 么 trw(x,i) 关 tru(x,i+1)， 这 是 因为 带头 的 移动 
改变 了 歌德 尔 数字 。 另 一 方面 ， 如 果 M 在 转换 i 之 后 停机 ， 那 么 tr, (x,i) =trw(x,i+1)， 因 为 当 配 置 
数 反 映 的 是 停机 配置 的 时 候 ， 函 数 nts nip 和 nin 都 返回 前 面 的 值 。 相 应 地 ，z 是 第 一 个 满足 tru (x,z) = 
tru(x,z+1) 的 数字 ， 机 器 会 在 z 次 转换 之 后 停机 。 

因为 任意 图 灵机 在 计算 结束 之 前 对 于 转换 的 次 数 都 没有 界定 ， 所 以 需要 无 限制 的 最 小 化 来 确定 这 
个 值 。 jw- 递 归 函 数 

term(x) =pz[ eq(tru(x,z) ,tru(x,z+1))] 
计算 了 当 使 用 M 来 对 输入 x 进行 计算 的 时 候 ， 在 停机 之 前 M 执行 过 的 转换 的 步 数 。 当 计算 停止 时 ， 
机 器 的 停机 配置 编码 为 tw (x, term (xz) ) 。 当 停机 时 ， 带 上 符号 的 形式 为 BCxz)B。 停 机 时 的 带 数 
字 ttn 可 以 从 停机 的 配置 数 
ttn(x) =dec(2,try(x,term(x))). 
中 获得 。 计 算 的 结果 可 以 通过 计算 带 上 1 的 个 数 ， 或 者 通过 计算 在 最 终 的 带 数字 中 2 ETT BOR 
确定 。 后 面 的 计算 可 以 利用 有 界 和 来 实现 


simu (x) =É hy eq(1 ,dec( i, ttn(x) ) ) ) +1, 


这 里 ”是 编码 在 终结 带 数字 中 的 带 上 的 段 的 长 度 。 边 界 y 是 通过 原始 递归 函数 gdin( ttn( x) ) 计算 得 来 
的 (练习 17)。 因 为 带 上 包含 了 f(x) 的 一 元 表示 ， 因 此 要 在 有 界 和 上 减 一 。 

当 M 存在 对 于 输入 x 的 f 的 定义 时 ，M 的 计算 和 对 M ARAB STH (x). WR Sx) RA EM, 
无 界 最 小 化 就 无 法 返回 值 ， 因 此 sim, 也 是 没有 定义 的 。simw 的 构造 过 程 完成 了 下 面 定理 的 证 明 。 

定理 13.7.1 每 个 图 灵 可 计算 函数 都 是 内- 递归 函数 。 

定理 13. 6. 4 和 定理 13. 7. 1 在 宏观 和 微观 的 计算 方法 之 间 建 立 了 等 价 性 。 

推论 13.7.2 一 个 函数 是 图 灵 可 计算 的 ， 当 且 仅 当 它 是 几 递 归 的 。 


13.8 修订 的 丘 奇 一 图 灵 论 题 


从 函数 的 角度 来 说 ， 丘 奇 一 图 灵 论 题 将 函数 的 有 效 计算 性 和 图 灵 可 计算 性 联系 在 一 起 。 利 用 定理 
13.7.2， 丘 奇 一 图 灵 论 题 可 以 使 用 /= 递归 函数 来 重新 建立 。 

丘 奇 一 图 灵 论 题 (修订 的 ) 一 个 数论 函数 是 可 计算 的 当 且 仅 当 它 是 几 -= 递 归 函 数 。 

同 往常 一 样 ， 我 们 并 不 给 出 丘 奇 一 图 灵 论 题 的 证 明 过 程 。 数 学 家 和 计算 机 科学 家 都 能 够 接受 这 一 
点 ， 因 为 这 个 命题 已 经 积累 了 相当 多 的 支持 证 据 。 接 受 丘 奇 一 图 灵 论 题 等 同 于 接受 “图 灵机 是 最 通用 
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的 计算 设备 ”一 样 。 这 个 定理 意味 着 任何 可 以 有 效 计算 的 数论 函数 都 可 以 利用 图 灵机 来 计算 。 这 二 点 
同样 可 以 延伸 到 非 数 字 性 的 计算 。 

我 们 首先 可 以 看 到 任何 数字 计算 机 上 的 计算 都 可 以 解释 为 数字 性 的 计算 。 计 算 机 之 间 通 常用 字符 
串 进 行 通讯 ， 而 之 所 以 使 用 字符 串 是 为 了 方便 数据 的 输入 以 及 更 好 地 解释 结果 。 输 入 将 利用 ASCH 或 
者 EBCDIC 编码 转换 为 10,11 的 字符 串 。 在 进行 转换 之 后 ， 输 入 的 字符 串 被 视 为 是 自然 数 的 二 进 制 表 
示 。 随 着 计算 的 进行 ， 就 会 产生 其 他 的 由 0 和 1 组 成 的 序列 ， 同 样 是 二 进 制 的 自然 数 。 输 出 通常 会 被 
转换 回 字符 数据 ， 因 为 我 们 通常 无 法 理解 和 识别 采用 内 部 表示 的 输出 。 

利用 下 面 的 例子 ， 我 们 可 以 设计 出 有 效 的 过 程 来 完成 从 字符 串 计算 到 数论 计算 的 转换 过 程 。 歌 德 
尔 数字 编码 可 以 用 来 完成 从 字符 串 到 数字 的 转换 。 设 立 = | a ,a ,…,a,| 是 字母 表 , ii f ARA Y E 
二 的 函数 。 为 了 从 字符 串 得 到 歌德 尔 数字 ， 首 先 要 为 字母 表 中 的 每 个 元 素 指定 惟一 的 一 个 数 。 为 了 
简单 起 见 ， 我 们 将 使 用 下 标 来 定义 对 中 的 元 素 。 字 符 串 a sa, ,… a, 的 编码 将 由 有 界 乘积 产生 ; 


pn(0)^** + pn(1)**! + ++ + pn(n)"! = II pn(j)', 


其 中 , 》 是 要 进行 编码 的 字符 串 的 长 度 。 
解码 函数 从 歌德 尔 数字 的 素数 分 解 中 提取 出 每 个 素数 成 分 的 指数 。 可 以 利用 解码 函数 和 字母 表 中 
的 数字 来 重新 构造 字符 串 。 如 果 x 是 对 中 字符 串 a, a, ssa, 的 编码 ,那么 dec(j,x) =ij。 最 初 的 字符 


的 函数 就 是 原始 递归 的 ， 因 此 函数 是 图 灵 可 计算 的 。 

将 字符 串 函数 了 转换 成 数字 的 函数 可 以 利用 对 字符 进行 数字 编码 TE 
和 从 数字 到 字符 的 解码 来 实现 。 FPEM = fe)er' 

在 丘 奇 一 图 灵 论 题 的 帮助 下 ， 我 们 可 以 证 明 函 数 /是 算法 可 计算 
的 ， 当 上 且 仅 当 它 相 应 的 数字 函数 了 是 图 灵 可 计算 的 。 我 们 应 该 注意 到 ”编码 解码 
当 了 是 图 灵 可 计算 的 时 候 ， 存 在 一 个 有 效 的 过 程 能 够 获得 f 的 值 。 计 4 
算 f 的 算法 包含 三 个 步 又: x€N — —  f'(x)eN 

i) 将 输入 字符 串 编码 为 数字 x, 

ii) HAS (x), 

iii) 对 A(x) 进行 解码 从 而 得 到 (4) , 

每 一 步 都 可 以 使 用 图 灵机 来 完成 。 

现在 假设 存在 有 效 的 过 程 能 够 计算 f。 利 用 编码 和 解码 函数 的 可 逆 性 ， 我 们 可 以 设计 出 一 个 可 以 
有 效 计算 了 的 过 程 。 A(x) 的 值 可 以 利用 如 下 的 步 台 得 到 : 将 输入 x 转 E : 
BAER us WAU), 将 fn) 进行 转换 从 而 得 到 f(x) 。 因 为 存在 “<= 一 一 > fer 
有 效 的 步 又 能 够 计算 ， 我 们 可 以 根据 丘 奇 一 图 灵 论 题 总 结 出 是 图 
灵 可 计算 的 。 解码 编码 

前 面 的 证 明 表 明了 丘 奇 一 图 灵 论 题 的 影响 。 图 灵机 的 计算 具有 普 " 

适 性 ， 而 不 仅 限于 数字 计算 和 判定 问题 。 一 个 字符 串 函 数 是 可 计算 xen -了 -= PEN 
的 ， 仅 当 该 函数 可 以 利用 图 灵机 以 及 图 灵 可 计算 的 编码 和 解码 机 制 来 
实现 。 下 面 的 例 13. 8. 1 展示 了 字符 串 函数 和 数字 函数 之 间 的 关联 关系 。 

例 13.8.1 iX - la, b) 是 字母 表 。 下 面 考察 交换 输入 字符 串 中 a 和 4b 的 函数 f: COD’. 
数论 函数 是 在 计算 了 的 基础 上 ， 增 加 了 对 于 上 字符 串 的 编码 和 解码 而 得 的 了 字母 表 中 的 成 分 使 用 函 
Bn ABET ECE AG: nla) =0,n(b) =1。 FRR um usu, cu, 可 以 编码 为 数字 

pn(o)™*! - pn( 1)! dEGA pn(n)" *? 
mm( 门 上 的 过 指数 被 编码 O 或 者 1; 而 这 取决 于 在 字符 串 中 第 1 个 元 素 是 4 还 是 b。 

设 x 是 字符 囊 在 号 上 的 编码 。 而 前 面 的 8din(x) 可 以 返回 编码 x 所 得 序列 的 长 度 。 因此， 有 
RRE 
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gdin( x) 


f(x) = II (eq( dec(i,x) ,0) + pn(i) + pn(i) + eq(dec(i,x) ,1) + pn(i)) 


可 以 产生 和 字符 串 u EU FIRE HE UAR ER 如 果 eq( dec(i,x),0) =1， 那 么 4 中 的 第 i 个 元 素 就 是 
a。 这 在 4 的 编码 中 由 pn(i)' 来 体现 。 乘积 


eq(dec(i,x),0) + pn(i) + pn(i) 


ETSO CT. prli)’. 28008, AEP (x), 4 u PAIS ETC B IE, pali) 的 指数 就 是 1。 
因此 , 了 构 造 了 一 个 数 ， 这 个 数 的 素数 分 解 可 以 通过 将 x 中 指数 1 和 2 进行 交换 而 得 到 。f (x) 到 字符 
串 的 转换 得 到 了 fu). O 


13.9 练习 


1. 


2. 


W g(x) =x ,h(x,y,z) 2x y ez f(x,y) Eh g 和 f 通 过 原始 递归 得 到 的 函数 。 计算 f(1,0)、f(1,1)、 
f(1,2) , f(5,0), f(5,1) fl f(5,2) KWARE. 

仅 使 用 基本 函数 、 组 合 和 原始 递归 操作 来 证 明 下 面 的 函数 是 原始 递归 的 。 当 使 用 原始 递归 的 时 候 ， 请 指 
HA PRK g 和 

a) ci 

b) pred 

c) f(x) 22x 42 


. 下 列 的 函数 都 是 利用 表 13-1 中 的 原始 递归 来 定义 的 。 请 明确 地 给 出 定义 中 所 使 用 的 函数 g RI 


a) sg 
b) sub 
c) exp 


. 证 明 下 列 命题 : 


a) 由 全 函数 hh 和 g,,… ,g, 组 合 定义 得 到 的 函数 8 也 是 全 函数 。 
b) HERZ h A g 利用 原始 递归 得 到 的 函数 也 是 全 函数 。 
c) 总 结 得 出 所 有 的 原始 递归 函数 都 是 全 函数 。 


. 设 g=id, h=p «p? ,f 是 由 函数 g 和 户 利 用 原始 递归 得 到 的 。 


a) 计算 A(3,0) ,f(3,1) 和 f(3,2) 的 值 。 
b) 给 出 函数 的 完整 定义 非 递 归 的 ) 。 


. We (x, y, z) 是 原始 递归 函数 ,证 明 下 面 的 函数 都 是 原始 递归 的 。 


a) f(x,y) =g(x,y,x) 
b) f(x,y,z,w) 2 g(x,y,x) 
c) f(x) 28(1,2,x) 


. 设 函数 了 为 


_ [x 如 果 x>2 
ee 
a) 给 出 图 灵机 执行 的 状态 图 。 


b) 证 明了 是 原始 递归 的 。 


. 证 明 下 面 的 函数 是 原始 递归 的 。 读 者 可 以 使 用 表 13-1 和 表 13-2 中 的 函数 和 谓词 。 不 允许 使 用 有 界 操 


作 符 。 


x 如果 x<y 并 且 x<z 
c) mins(x,y,z) -dy 如 果 y<x 并 且 y<z 
z 如 果 z<x 并 且 z<y 
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d) even(x) «f NR: 
e) half(x) =div(x,2) 


"£) sqrt(x) 2 Lx | 


9. 证 明 下 面 的 谓词 都 是 原始 递归 的 。 可 以 使 用 表 13-1 和 表 13-2 以 及 练习 8 中 的 函数 和 谓词 。 不 允许 使 用 


有 界 操作 符 。 
1 z 
b) ge(x,y) -人 T 
c) btw(x,y,z) 2 dug 
l 如 果 x 的 平方 根 是 整数 
a) pr) = 15 “其 他 情况 


10. 设 上 是 有 两 个 变量 的 原始 递归 函数 ， 并 且 定 义 六 如 下 
f(x,0) =t(x,0) 
f(x,y+1) =f(x,y) +t(x,y +1) 
请 给 出 借助 于 原始 递归 定义 了 的 函数 g A ho 
11. Weg 和 hh 是 原始 递归 函数 。 使 用 有 界 操作 来 证 明 下 面 的 函数 是 原始 递归 的 。 这 里 读者 可 以 使 用 任何 已 经 
证 明 为 原始 递归 的 谓词 和 函数 。 


1 cy. ! 
a) fa =le UN iy, g(i) «g(x) 
: T TREE Ox is i) = 
b) fo)» [, Api als cd iy, g(i) =x 
c) fly) = D ”如果 对 于 有 些 的 0<i,j<y, 有 gli) - AG) 
»*lo 其 他 情况 
_ [1 如 果 对 于 所 有 的 0<i<y, 有 g(i) «g(i 1) 
d) fo) - ls CUN 


e) nt(x,y) = 在 0<i<y 范围 内 ,g(i) =x 的 次 数 
0 对 于 0<i<y,g(i) =x 不 会 超过 三 次 

ee ed ea 

g) irg(x,y) = 在 0<i<y 范围 内 ,满足 8 (i) =x 的 最 大 数 
12. 证 明 下 面 的 函数 都 是 原始 递归 的 : 

a) gcd(x,y) =x 和 y 的 最 大 公约 数 

b) lem(x,y) =x 和 y 最 小 的 公 售 数 

2 juice) 2 如 果 对 于 某 个 n, 有 x=2” 
0 ”其 他 情况 
1 “如 果 直 是 两 个 素数 的 乘积 


4) moprGO = [o seii 


“13. 设 8 是 单个 变量 的 原始 递归 函数 。 证 明 下 面 的 函数 


f(x) =min( g(i)) 
=min|g(0),.. ,g(x) | 
是 原始 递归 的 。 
14. 证 明 当 p 和 4 为 原始 递归 时 ， 函 数 


f CORR Xp) a ^ tex y yk, ,2)] 
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I5; 


*20. 


21; 


22; 


是 原始 递归 的 。 

计算 下 面 序列 的 歌德 尔 数字 : 

a) 3,0 

b) 0,0,1 

c) 1,0,1,2 

d) 0,1,1,2,0 426 


- 确定 下 列 歌德 尔 数字 所 编码 的 序列 : 


a) 18,000 
b) 131,072 
c) 2,286,900 
d) 510,510 


. 证 明 下 列 函数 是 原始 递归 的 : 


1 如 果 x 是 某 个 序列 的 歌德 尔 数字 

0 其 他 情况 

n 如果 x 是 某 个 长 度 为 n 序列 的 歌德 尔 数字 

0 其 他 情况 

1 如 果 x 是 歌德 尔 数字 ,而 y 在 x 的 编码 序列 中 出 现 
0 其 他 情况 


a) gdn(x) =f 
b) gdin(x) -[ 


e) G) =f 


. 构造 一 个 原始 递归 函数 ， 它 的 输入 是 编码 的 有 序 对 ， 它 的 输出 也 是 有 序 对 ,但 是 有 序 对 中 元 素 的 位 置 


进行 了 交换 。 例 如 ， 如 果 输 入 是 [x,y] ， 那 么 输出 就 是 [y,x] 。 


.函数 定义 如 下 : 
1 如 果 x=0 
2 如 果 x=1 
f(x) = 3 Hi x-2 


f(x-3) «f(x-1) 其 他 情况 

请 给 出 上 4) 、f(5) 和 A6) 的 值 。 证明 f 是 原始 递归 的 。 
WE g 和 g 是 单个 变量 的 原始 递归 函数 。 设 万 Ah, 是 四 个 变量 的 原始 递归 函数 。 两 个 函数 有 和 所 定 
义 如 下 : 

fi(x,0) =g (x) 

f(x,0) 2g, (x) 

fO +1) 2h (x,y f(x,y) ,f(x,y)) 

flx, y +1) =h (x,y,f (x,y) ,h(x,y)) 
3X HL f, RI fo BRAM g 和 8 AK h A h, 进行 了 同步 递归 (simultaneous recursion), fi (x,y+1) 和 
(x,y+1) 都 是 使 用 利用 前 面 的 函数 值 定义 的 。 证 明 fi 和 所 是 原始 递归 的 。 427 
函数 f 的 定义 如 下 : 

f(0) =1 


foD = Y fy’. 


a) WASA), f(2) f f() 8518 

b) 使 用 串 值 递归 来 证 明 f 是 原始 递归 的 。 

设 函 数 A 是 阿 克 曼 函数 (IL 13.6 45), 

a) 18. A(2,2) 

b) 证 明 对 于 每 个 x,ye N，A(x,y) 的 值 是 惟一 的 。 
c) 证 明 A(1,y)=y+2。 

d) 证 明 A(2,y) =2y +3, 
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23. 


* 24. 


23; 
26. 


2]. 


*28. 





证 明 下 面 的 函数 都 是 递归 的 。 函 数 g Ah ABR BAY. 
_ [1 HD x 的 平方 根 是 整数 
cubes) = 15 其 他 情况 
b) root(c,,c,,c,) = 四 元 多 项 式 c,* x, +c, “x+co 的 最 小 自然 数 根 
-Ji WRU THT i20, A gli) =g(i+x) 
1 ”其 他 情况 
i 如 果 对 于 所 有 的 i=0,， A g(i) -h(i) «x 


— 


a 


c) r(x) 
I(x) = 


d 


— 


O 其 他 情况 

如 果 对 于 某 个 i,je N， 有 g(i) +h(j) =x 
1 其 他 情况 
1 如 果 对 于 某 个 y>x,z>x,， 有 8(y) =h(z) 
0 f = 其 他 情况 。 
无 界 的 /操作 符 可 以 用 来 定义 下 面 的 部 分 谓词 : 

xs e f BMF OSI <j, A p(x,...,x,i) =0,MA p(x,,.. Xn) =1 
* 1 ”其 他 情况 。 

即 ,在 出 现 第 一 个 满足 p(x ,…,x,,j) =1 的 7 之 前 ;对 于 某 些 i, 如 果 p(x,,…,x,,j) T 那么 值 是 没有 
定义 的 。 证 明 通 过 将 定义 13. 6. 3 中 的 无 界 最 小 化 操作 符 蔡 换 为 前 面 的 操作 符 ， 可 以 得 到 的 函 
数 家 族 是 图 灵 可 计算 函数 。 
为 例 13.7.1 里 面 的 图 灵机 S H ns, ntp All nts PCS 
设 M 如 下 


e) f(x) = 





1/1 R 


a) M 计算 的 是 什么 样 的 一 元 数论 函数 ? 
b) 在 M 对 于 输入 为 0 的 执行 计算 的 过 程 中 ， 给 出 每 个 配置 的 带 数字 。 
c) 在 M 对 于 输入 为 2 的 执行 计算 的 过 程 中 ， 给 出 每 个 配置 的 带 数 字 。 
假设 函数 定义 如 下 : 
fix) ee WFR x 是 偶数 
x-1 其 他 情况 。 

a) 给 出 计算 f 的 图 灵机 M 的 状态 图 。 
b) 追踪 机 器 对 于 输入 1 (B118) 的 计算 过 程 。 给 出 计算 过 程 中 每 个 配置 对 应 的 带 数 字 。 对 于 计 

算 中 的 每 一 步 ， 给 出 trw(1,i) 的 值 。 
c) 证 明 f 是 原始 递归 的 。 你 可 以 使 用 在 13.1 节 、13.2 节 和 13.4 节 中 已 经 证 明 是 原始 递归 的 

函数 。 
设 M 为 图 灵机 ， 而 try, 是 M 的 追踪 函数 
a) WEH RŽ 

E E h 如 果 M 对 于 输入 x 的 第 y 次 转移 打印 了 空格 

i o 其 他 情况 
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是 原始 递归 的 。 
b) WEH KA 
Opp MUR M 对 于 输入 x 的 最 后 一 次 转移 打印 了 1 
rs) - 其他 情况 ! 
PETITS 


c) 借助 于 打印 问题 的 不 可 判定 性 (FR 12.7) ， 解 释 为 什么 iprt 不 是 原始 递归 的 。 

29. 给 出 一 个 不 是 4 递归 函数 的 例子 。 提 示 : 考虑 一 个 不 是 递归 可 枚 举 的 语言 。 

30. 设 f 为 从 la, b] 到 la, b] 的 函数 ,定义 为 Au) = 尼 。 构 造 原始 递归 函数 户 ， 使 得 它 能 够 结合 
编码 函数 和 解码 函数 计算 fo 

31. 如 果 一 个 数论 函数 可 以 通过 分 别 执行 前 驱 函 数 和 后 继 函 数 的 图 灵机 S A D 以 及 在 9.3 节 定 义 的 宏 
来 计算 ; 那么 这 个 函数 就 可 以 被 称 为 宏 可 计算 的 〈macro- computable) 。 证 明 每 个 — 递归 函数 都 
是 宏 可 计算 的 。 为 此 ， 需 要 证 明 : 
i) 后 继 函 数 、 零 函数 和 投影 函数 都 是 宏 可 计算 的 。 
i) 宏 可 计算 函数 在 组 合 、 原 始 递 归 和 无 界 最 小 化 操作 下 面 是 闭合 的 。 

32. 证 明 在 9. 6 节 中 定义 的 编程 语言 TM 能 够 计算 整个 久 -递归 函数 的 结合 。 


参考 文献 注释 


关于 函数 和 机 械 的 可 计算 性 的 研究 在 上 世纪 30 年 代 得 到 了 很 大 的 发 展 。GCidel [1931] 定义 了 一 
种 计算 的 方法 ， 现 在 被 称 为 Herbrand- Cidel 可 计算 性 。Kleene 对 Herbrand- Gödel 可 计算 性 和 -递归 函 
数 的 性 质 进 行 了 深入 的 研究 。 =- 递归 函数 和 图 灵 可 计算 函数 的 等 价 性 由 Kleene [1936] 证 明 。 波 斯 
特 系统 [ Post, 1936] 提供 了 另外 一 种 执行 数字 计算 的 方法 。Kleene [1952] 的 经 典 著作 提出 了 可 计 
算 性 、 丘 奇 一 图 灵 论 题 和 递归 函数 。 关 于 递归 函数 理论 的 进一步 研究 可 以 在 Hermes [ 1965 ] Péter 
[1967] 和 Rogers [1967] 中 找到 。Hennie [1977] 在 抽象 的 算法 家 族 概念 中 提出 了 可 计算 性 。 

阿 克 曼 函数 是 由 Ackermann [1928] 提出 的 。 对 于 阿 克 曼 函数 性 质 的 分 析 可 以 在 Hennie [ 1977 | 
中 找到 。 
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第 四 部 分 
计算 复杂 性 


前 面 各 章 的 主要 目的 是 刻画 可 解 问题 和 可 计算 函数 的 集合 。 现 在 我 们 开始 把 注意 力 从 证 明 问题 存 
在 算法 解 转 向 分 析 它们 的 复杂 性 。 复 杂 性 是 由 确定 解 所 需要 的 资源 来 度量 的 。 因 此 ， 正 如 引言 中 首先 
提出 的 ， 我 们 开始 形式 化 地 分 析 多 少 的 问题 。 

复杂 性 理论 致力 于 区 分 在 实践 中 可 解 的 问题 和 那些 仅仅 在 原理 上 是 可 解 的 问题 。 理 论 上 可 解 的 问 
题 并 不 一 定 有 实际 的 解 ;也许 不 存在 能 够 解决 这 个 问题 、 同 时 又 不 需要 特别 大 的 时 间或 存储 资源 的 算 
法 。 不 存在 有 效 算 法 的 问题 被 称 为 难 解 问题 (intractable) 。 

既然 我 们 感 兴趣 的 是 问题 内 在 的 复杂 性 ， 因 此 分 析 应 该 独立 于 任何 特定 的 实现 。 为 了 将 问题 的 特 
征 从 实现 特征 中 分 离 出 来 ， 必 须 选 择 一 个 单独 的 算法 系统 用 于 分 析 计 算 复 杂 性 。 同 时 这 个 选择 不 应 该 
在 计算 上 附加 任何 不 必要 的 约束 ， 诸 如 时 间或 可 用 存储 的 限制 ， 因 为 这 些 限制 是 实现 的 属性 而 不 是 算 
法 本 身 的 属性 。 标 准 图 灵机 满足 以 上 所 有 要 求 ， 并 能 为 分 析 问 题 复杂 性 提供 基础 的 计算 框架 。 此 外 ， 
丘 奇 一 图 灵 论 题 确 保 任何 有 效 的 过 程 都 能 在 这 样 的 机 器 上 实现 。 

图 灵机 的 时 间 和 空间 复杂 性 分 别 度量 转换 的 数量 和 计算 中 所 需 的 带 的 数量 。 使 用 确定 型 图 灵机 在 
多 项 式 时 间 内 可 解 的 了 类 问题 通常 被 认为 包含 了 所 有 有 效 的 可 解 问题 。 另 一 类 问题 ，N 了 问题， 包含 
了 所 有 使 用 非 确定 型 图 灵机 在 多 项 式 时 间 内 可 解 的 判定 问题 。 显 然 ， 了 是 N9 的 一 个 子 集 。 当 前 ， 这 
两 类 问题 是 否 是 等 价 的 仍然 无 从 得 知 。 

使 用 非 确定 型 解 的 猜想 一 检查 策略 ( guess-and-check strategy), NP 类 包含 所 有 在 多 项 式 时 间 内 
可 对 解 进行 验证 的 问题 。 回 答 = NP 问题 等 价 于 判定 针对 一 个 问题 构造 解 在 本 质 上 是 否 比 检查 一 个 
可 能 性 是 否 是 解 更 困难 。 虽 然 这 似乎 是 理所当然 的 ， 然 而 尚未 被 形式 化 地 证 明 。 

一 个 问题 是 NP 完全 的 ， 如 果 N? 类 中 的 每 个 问题 都 可 在 多 项 式 时 间 内 被 化 简 为 该 问题 。 那 么 为 
一 个 NP 完全 问题 找到 多 项 式 时 间 解 就 足以 证 明了 = NP 。 但 是 ， 到 目前 为 止 仍然 没有 发 现 这样 的 算 
法 。 此 外 ， 大 多 数 计算 机 科学 家 和 数学 家 并 不 相信 存在 这 样 的 算法 。 对 NP 完全 性 的 检查 开始 于 通过 
显 式 地 将 N? 类 中 的 问题 化 简 为 NP 完全 问题 ， 从 而 说 明 可 满足 性 问题 是 NP 完全 的 。 

许多 学 科 的 问题 都 被 证 明 是 NP 完全 的 ， 这 些 学 科 包 括 模式 识别 、 调 度 、 决 策 分 析 、 组 合 数学 、 
网 络 设计 和 图 论 等 。 判 定 一 个 问题 是 NP 完全 的 并 不 意味 着 不 再 需要 解 ， 而 仅仅 表明 很 可 能 不 存在 能 
在 多 项 式 时 间 内 求解 的 算法 。 人 们 常常 使 用 近似 算法 高 效 地 为 NP 完全 的 最 优化 问题 生成 近似 最 优 解 。 
为 了 说 明 在 获取 近似 解 时 常 采纳 的 策略 ,我 们 将 介绍 几 个 著名 NP 完全 问题 的 近似 解 求解 算法 ， 这 些 
算法 能 够 在 预定 义 的 精度 范围 内 生成 近似 解 。 





第 14 章 ”时间 复杂 性 


我 们 从 确定 型 图 灵机 的 时 间 复 杂 性 分 析 研究 计算 复杂 性 。 确 定型 图 灵机 的 时 间 是 由 计算 中 转换 的 
数量 度量 的 。 由 于 用 同样 长 度 字符 串 初始 化 的 计算 中 的 转换 数量 不 同 ， 因 此 通常 使 用 增长 的 速度 来 描 
述 时 间 复杂 性 。 我 们 将 会 看 到 实现 于 确定 型 多 道 和 多 带 图 灵机 的 算法 的 时 间 复 杂 性 与 实现 于 标准 图 灵 
机 的 算法 的 时 间 复杂 性 仅仅 有 多 项 式 的 差别 。 

语言 的 时 间 复杂 性 是 由 接收 该 语言 的 机 器 决定 的 。 这 里 将 介绍 语言 复杂 性 的 若干 重要 属性 。 首 
先 ， 在 时 间 复杂 性 方面 ， 没 有 接收 一 种 语言 的 最 好 的 图 灵机 。 任 何 需 要 的 线性 因素 (linear factor) 都 
可 用 来 为 一 个 接收 语言 的 机 器 “加 速 *， 从 而 生成 男 外 一 个 复杂 性 小 的 机 器 。 加 速 原理 (speedup theo- 
rem) 可 以 生成 一 个 更 快 的 机 器 ,但 是 其 时 间 复 杂 性 与 原 机 器 有 同样 的 增长 速度 。 同 时 ;我们 还 将 介 
绍 这 样 一 种 语言 ， 对 其 而 言 不 存在 有 最 小 渐 近 时 间 复 杂 度 的 图 灵机 。 对 于 任何 接收 这 种 语言 的 图 灵 
机 ， 我 们 都 能 构造 男 外 一 个 (严格 来 说 ) 增长 速率 更 小 ， 从 而 时 间 复杂 性 更 小 的 图 灵机 。 最 后 ， 本 音 
将 阐述 不 存在 语言 时 间 复 杂 性 的 上 界 。 对 任何 的 计算 函数 而 言 ， 都 存在 一 种 语言 ， 其 复杂 性 不 会 被 该 
函数 的 值 所 限定 。 

正 奇 一 图 灵 论题 保证 了 任何 一 个 使 用 现代 计算 机 技术 可 解 的 问题 对 于 图 灵机 都 是 可 解 的 ， 但 这 却 
与 两 个 系统 计算 的 复杂 性 无 关 。 本 章 我 们 将 介绍 使 用 图 灵机 模拟 计算 机 的 计算 ; 同时 ， 图 灵机 中 转换 
的 数量 仅仅 随 着 计算 机 执行 指令 的 数量 多 项 式 地 增长 。 因 此 ， 图 灵机 必需 的 资源 边界 能 够 提供 关于 算 
法 复杂 性 和 计算 机 程序 的 有 用 信息 。 


14. 1 复杂 性 度量 


计算 复杂 性 研究 的 两 个 主题 是 解决 一 个 特定 问题 的 算法 的 评估 和 不 同 问题 固有 难度 的 比较 。 本 部 
分 内 容 要 关注 的 是 后 一 个 问题 ， 但 是 问题 复杂 性 的 比较 要 求 我 们 具有 分 析 解 决 实际 问题 的 算法 的 能 
力 。 为 了 了 解 算法 分 析 的 主要 问题 ， 我 们 首先 考虑 度量 以 下 四 个 相似 问题 的 时 间 复 杂 性 ; 
为 一 个 整数 数组 排序 
输入 : 数组 A [1..n] 
输出 : 排序 的 数组 A’ [1.. 5] 


KERALA 
输入 : 整数 矩阵 B,、， 
输出 : EE C = B? 


有 向 图 的 路 径 问 题 

输入 : 图 G= (Ni; A), 节点 v, v, € N 

输出 : 是 ;如果 G 中 存在 一 条 从 v, 到 v 的 路 径 
否 ; 否则 


图 灵机 M (对 任何 输入 都 停机 ) 的 接收 性 (acceptance) 
输入 : 字符 串 w 
输出 : 是 ; 如 果 M 接收 w 
否 ; 否则 
前 两 个 问题 的 计算 中 所 描述 的 算法 计算 函数 。 排 序 问题 在 数组 之 间 进 行 映射 ， 求 平方 问题 在 矩阵 
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之 间 进 行 映射 。 路 径 和 接收 性 问题 是 判定 问题 ， 其 结果 为 “是 ”或 者 “ 否 ”。 

复杂 性 函数 描述 了 解决 一 个 问题 所 需要 的 资源 或 者 步 又 的 数目 ， 被 度量 的 内 容 随 着 问题 的 不 同 而 
有 所 变化 : 数据 移动 的 数量 ,执行 的 算术 操作 的 数量 ,执行 的 指令 的 数量 ,使 用 的 空间 的 数量 等 等 。 
其 目标 不 是 计算 每 个 可 能 输入 的 精确 的 资源 需求 ， 而 是 提供 信息 以 确保 对 每 一 个 输入 而 言 可 以 获得 充 
足 的 资源 。 

一 个 算法 的 复杂 性 分 析 需 要 一 下 三 项 内 容 : 识别 出 需要 考虑 的 资源 ， 根 据 输 入 的 复杂 性 对 输入 实 
例 分 类 ， 构 造 一 个 能 将 输入 复杂 性 和 资源 利用 关联 起 来 的 函数 。 

识别 出 需要 度量 的 资源 后 ， 下 一 步 工作 就 是 要 把 输入 实例 的 集合 分 类 。 分 类 中 的 每 一 个 集合 包含 
了 具有 相似 属性 的 实例 ， 并 且 对 于 任何 一 个 这 样 的 集合 ， 其 包含 的 实例 的 复杂 性 都 可 以 用 一 个 相关 的 
自然 数 来 表示 。 表 14-1 给 出 了 前 面 所 述 四 个 例子 问题 的 输入 域 的 标准 分 类 。 例 如 ， 排 序 问题 的 输入 实 
例 按 照 数组 的 大 小 分 组 ， 分 类 的 结果 是 一 系列 的 集合 Au,A,,A:,…， 其 中 A; 包含 所 有 大 小 为 i 的 数 
组 。 数 字 i 是 与 集合 A, 的 实例 相关 的 输入 复杂 性 。 


表 14-1 复杂 性 函数 的 组 成 : 
问题 输入 复杂 性 需要 度量 的 资源 占用 状况 











排序 问题 数组 的 大 小 数据 移动 的 数量 

求 平方 问题 和 矩阵 的 维度 数值 乘法 的 数量 

路 径 问题 图 中 节点 的 数目 搜索 中 访问 的 节点 数量 
接收 性 问题 ， 输入 字符 串 的 长 度 计算 中 转换 的 数量 


用 了 表示 一 个 输入 实例 被 分 类 为 复杂 性 类 I, ,I L ,… 的 问题 ， 其 中 下 标 表示 每 个 类 的 数字 化 的 复 
杂 性 。P 的 一 个 解 的 复杂 性 函数 描述 一 个 类 中 任何 问题 实例 的 最 大 资源 占用 。 也 就 是 说 ， 一 个 复杂 
性 函数 是 从 自然 数 (输入 的 复杂 性 度量 ) 到 自然 数 (资源 使 用 ) 的 映射 ， 这 个 映射 表示 了 类 中 每 
一 个 问题 实例 资源 占用 的 上 界 。 

当 我 们 比较 解决 同样 的 问题 的 算法 时 ， 输 入 的 复杂 性 和 需要 考虑 的 资源 通常 会 在 特定 于 问题 的 内 
容 中 给 出 。 例 如 ， 分 析 排 序 问 题 时 使 用 的 度量 与 表 14-1 类 似 。 冒 泡 排序 ， 归 并 排序 和 插入 排序 的 输入 
都 是 数组 并 且 这 些 排序 算法 都 移动 数据 。 因 此 ， 根 据 数据 移动 的 次 数 来 比较 这 些 算法 的 效率 就 是 
合理 的 。 

当 比较 解决 不 同 问题 的 算法 时 ， 特 定 于 问题 的 度量 就 毫 无 意义 了 。 一 个 排序 算法 的 数据 移动 次 数 
与 一 个 图 遍历 时 访问 的 节点 数量 之 间 有 什么 关系 ? 即使 我 们 知道 每 个 算法 的 复杂 性 函数 ， 我 们 也 无 法 
比较 算法 的 效率 或 者 问题 的 相对 难度 。 输 入 复杂 性 的 估计 更 加 不 合理 ， 我 们 没有 理由 相信 为 一 个 大 小 
为 n 的 数组 排序 所 需要 的 资源 应 该 与 搜索 一 个 包含 n 个 节点 的 图 所 需要 的 资源 相关 。 然 而 ， 以 这 些 问 
题 的 高 层 组 件 的 形式 而 定义 的 复杂 性 函数 会 给 出 这 样 的 信息 。 

为 了 比较 不 同 的 问题 ,解决 方案 必须 在 一 个 通用 的 算法 系统 中 实施 ， 这 样 才能 通过 同样 的 输入 度 
量 和 资源 使 用 来 分 析 复 杂 性 。 图 灵机 为 问题 复杂 性 的 研究 提供 了 理想 的 算法 系统 。 对 一 个 计算 而 言 ， 
图 灵机 没有 人 为 的 存储 限制 和 可 用 时 间 限 制 。 此 外 ， 丘 奇 一 图 灵 论 题 为 任何 有 效 的 过 程 都 能 在 图 灵机 
上 应 用 提供 了 保证 。 所 有 问题 共同 的 输入 度量 是 输入 字符 串 的 长 度 。 图 灵机 的 时 间 和 空间 复杂 性 描述 
了 一 个 计算 所 需 的 转换 的 次 数 和 带 上 方 格 的 数目 。 


14.2 增长 的 速度 


有 时 候 获取 输入 复杂 性 和 资源 使 用 之 间 的 精确 的 关系 相当 困难 ， 并 且 它 们 提供 的 信息 几乎 总 是 多 
于 我 们 需要 的 信息 。 正 因 如 此 ， 时 间 复 杂 性 通常 使 用 复杂 性 函数 的 增长 速度 来 表示 而 不 是 使 用 复杂 性 
函数 本 身 。 在 继续 评估 算法 复杂 性 之 前 ,我 们 要 首先 回顾 一 下 函数 增长 速度 的 数学 分 析 。 

一 个 函数 的 增长 速度 对 输入 任意 变 大 时 函数 的 渐 近 的 性 能 进行 度量 。 直 觉 上 ， 增 长 速度 取决 于 对 
函数 增长 影响 最 大 的 项 。 表 14-2 XR SERE PROC n 和 函数 n+2n € 5 的 增长 来 度量 独立 的 项 对 一 个 函 
数 的 影响 。 我 们 通过 最 下 面 一 行 w An? 2n +5 的 函数 的 比值 来 度量 它们 在 增长 中 所 起 到 的 作用 。 函 
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Bon’ +2n+5 的 线性 项 和 常量 项 称 为 低 阶 项 (low-order item) 。 低 阶 项 可 以 对 函数 的 初始 值 有 不 正当 
的 影响 。 当 n 变 大 时 ， 低 阶 项 显然 不 能 显著 影响 函数 值 的 增长 。 我 们 将 介绍 使 用 函数 的 阶 和 “大 o” 
表示 法 来 描述 函数 值 的 渐 近 增长 。 


表 14-2 函数 的 增长 


n 0 5 10 "25 50 100 1,000 
n? 0 25 100 625 2,500 10,000 1,000,000 
n’ +2n+5 5 40 125 680 2,605 10,205 1,002,005 
n/ (n? «2n 45) 0 0. 625 0. 800 0. 919 0. 960 0. 980 0. 998 


定义 14.2.1 ibd f; NN 和 函数 8: NON 是 单 变 量 的 数论 函数 。 

1) HARSHA gH, AA EIE AC cH B Rn, i—i n2 ni f(n) Sc- gln). 

i) g 的 阶 的 所 有 函数 的 集合 表示 为 0(8) = |f|f 是 g tM}, mE “g HAR”, 

当 一 个 函数 8 的 值 在 g 值 的 常数 倍 范围 内 时 , f 是 8 的 阶 。 由 于 低 阶 项 的 影响 ，f(n) &c- g(n) m 
的 不 等 关系 仅仅 用 于 控制 那些 比特 定数 字 大 的 输入 。 当 f 是 8 的 阶 时 ， 我 们 可 以 说 g 为 提供 了 一 个 
渐 近 的 上 界 。 

在 传统 意义 上 , f= 0(8) 用 于 表示 /是 8 的 阶 。 因 为 O(g) 是 一 个 集合 ， 所 以 更 准确 的 写法 是 
fe O(g8)。 这 里 使 用 不 是 那么 传统 的 “ =” 来 表示 了 是 g 的 阶 是 因为 ,通常 在 一 些 表达 式 中 0( 2) RA 
的 是 集合 中 的 任意 一 个 元 素 。 例 如 ， 一 个 函数 可 以 写作 f(n) =n? +O(n), ix3em ft —^ m n Ex 
些 低 阶 的 并 且 近 似 边界 是 n 的 项 组 成 ， 而 不 是 某 些 特定 的 低 阶 项 s 我 们 将 用 fE O( g) Sem f EE g HOY, 
通常 读 作 “f 是 g 的 大 欧 ”。 

例 14.2.1 Bn) =n,g(n) =n’, 那么 feO(g) 并 且 g gO0(f)。 BR, neO(m), Hym «n 
对 所 有 自然 数 都 成 立 。 

如 果 我 们 假设 we O( n^). 成 立 ,那么 必然 存在 常数 c 和 n,， 使 得 对 于 所 有 n2 ny 都 有 

n<c-n — nem. 
成 立 。 选 择 的 n+1 和 c+1 Kn, HAm-n-m»cmBno»n, 与 以 上 不 等 式 矛盾 。 因 此 
我 们 的 假设 错误 ,， 即 ng O(n’), i 四 

如 果 函 数 fe O(g) 并 且 ge O(f)， 那 么 我 们 说 f 和 g 具有 同样 的 增长 速度 。 当 f 和 g 具有 同样 的 增 

长 速度 时 ,根据 定义 14. 2. 1 有 以 下 两 个 不 等 式 

f(n) Se, + g(n) nzn, 

g(n)sc-:f(n  nzn, 
RP c 和 c 是 正常 数 。 结 合 以 上 两 个 不 等 式 我 们 就 会 看 到 ， 每 个 函数 的 上 界 和 下 界 都 是 另外 一 个 函 
数 与 常数 的 乘积 : 

f(n)/c, &g(n) xc; + f(n) 

g(n)/c, <f(n) <c, + g(n). 
UE X ONT BUR tin, Ain, X18 ndr. Ae AAR, BIUÁAB SRAA RU g 都 不 可 能 比 对 方 
增长 的 快 。 

例 14.2.2 Bfn) =n’ +2n+5 A g(n) =n’, WA feO(g)JEHgeO(f. AW 

n «n +2n+5 
对 所 有 自然 数 成 立 ， 即 设 c 为 1 并 且 m 为 0 时 上 式 满足 定义 14.2. 1 WA, EL ge Of). 
为 了 证 明 反 方向 的 关系 ,我 们 首先 说 明 当 nz 1H 2n<2n? B 5se5m, 所 以 有 
f(n) =n +2n4+5 
<n’ +2n +5n° 
z8n 
=8 - g(n) 
对 n 三 1 成 立 。 在 大 O 的 术语 中 ， 以 上 不 等 式 即 表 示 mn +2n +5 € O(n’), 口 
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如 果 f 和 g 具有 同样 的 增长 速度 ,， 那么 g 叫做 f 的 渐进 紧密 边界 (asymptotically tight bound) 。 

集合 
@(g) = ifl feO(g) A ge O(f)} 

包含 了 所 有 以 g 为 渐 近 紧密 边界 的 函数 。 在 大 O RARE, RM fe Ce) RA 8 是 f 的 渐进 紧密 
边界 。 

一 个 整 系数 多 项 式 是 一 个 如 下 所 示 的 函数 

f(n) =c, n «cz, * n" 0 ntc, 

其 中 o.c uc, -是 任意 整数 ，c, 是 非 零 整数 ，r 是 正 整 数 。 常 量 c, JE RC IRL, rA 
数 。 负 数 系 数 会 导致 函数 产生 负 值 。 例 如 ， 如果 f(n) 2m -3n-4, RAFO) = -4,f(1) = -6， 
f(2) = -6,f(3) = -4。 对 所 有 的 自然 数 ， 多 项 式 g(n) = -r -1 永远 小 于 零 。 

以 上 我 们 在 数论 函数 上 定义 了 增长 的 速度 。 绝 对 值 函 数 可 用 于 将 任意 值 多 项 式 转换 为 数论 函数 。 
一 个 整数 i 的 绝对 值 是 一 个 非 负 整数 ， 其 定义 如 下 : 

lil -{' 如 果 i20 
-i 否则 

使 用 绝对 值 组 合 f 将 产生 一 个 数论 函数 |f|。 多 项 式 了 的 增长 速度 定义 为 | f1 的 增长 速度 。 

例 14. 2. 1 和 例 14. 2. 2 介绍 的 技术 可 用 于 证 明 多 项 式 的 次 数 与 其 增长 速度 之 间 的 一 般 关系 。 

定理 14.2.2 设 f 是 一 个 r 次 多 项 式 ， 那么 

i) fe8(n), 

ii) fe O(n) HHA k > r RS, 

iii) feO(n ) SJ A k «rs, 

定理 14. 2. 2 的 一 个 结论 是 任何 一 个 多 项 式 的 增长 率 可 由 一 个 产 形式 的 函数 刻画 。 第 一 个 式 子 表 
示 7 次 多 项 式 与 六 有 相同 的 增长 速度 。 此 外 ， 式 子 〈 站 ) MAF (ui) 说 明 ， 当 与 7 不 同时 , r 次 多 
项 式 的 增长 速度 与 不同 。 

用 于 度量 算法 性 能 的 其 他 的 重要 函数 还 包括 对 数 函数 、 指 数 函 数 和 阶乘 函数 。 一 个 以 a 为 底 的 数 
论 对 数 函 数 定义 如 下 : 

f(n) =|10g,(n)|. 
可 以 利用 常数 乘积 改变 对 数 函 数 的 底数 从 而 改变 其 值 。 具 体 如 下 : 
log, (n) =log,(b) log, (n). 

这 个 定义 说 明 对 数 函 数 的 增长 速度 与 其 底数 无 关 。 

例题 14. 2. 1 和 例题 14. 2. 2 使 用 了 大 O 的 定义 来 比较 多 项 式 函数 的 增长 速度 。 当 函数 更 加 复杂 
时 ， 通常 使 用 极限 来 判定 两 个 函数 的 渐进 复杂 性 会 更 加 容易 一 些 。 设 f 和 g 是 两 个 数论 函数 ， 那 么 


L limi A -0, 那么 fe (GER geol). 


2. nim’ - e(0 «c o), JA fe 9(8) FH gO). 


3. Rim =æ , EA fe 0(8) JER ae O(N. 
用 这 种 方式 来 判定 函数 的 增长 速度 通常 需要 首先 应 用 洛 必 达 法 则 获取 极限 。 
用 于 复杂 性 分 析 的 洛 必 达 法 则 断 诗 ， 当 a 趋 于 无 穷 时 ， 如 果 f 和 g 是 从 R* 到 R 的 函数 并 且 是 连 
续 的 可 微 的 ， 那 么 
CPU 
mag(n) eg" (n) 
DEAE fg! SPIE f A g 的 导数 。 例 14. 2. 3 使 用 极限 和 洛 必 达 法 则 证 明了 对 于 任何 底数 为 a 的 对 
数 函 数 都 有 nlog,(n) eO(n)。 
例 14.2.3 db f(n) =nlog,(n) E g(n) =n", TERES UR f) /e(n) HF s 
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li 





noe n- 2n 


. nlog,(n) .. log,(n) +n(log,(e)/n) 
m 5 =lim 
n s$ 


log, (e) 





Hh, e 是 自然 对 数 的 底数 。 由 于 极限 是 0， 所 以 fe O(g). 


口 


定理 14. 2. 3 比较 了 对 数 函 、 指 数 函 数 和 阶乘 函数 以 及 多 项 式 函 数 的 增长 ， 证 明 留 作 练 习 。 


定理 14.2.3 设 r 是 一 个 自然 数 ,，a 和 4b 是 大 于 1 MEK, 

i) log,(n) eO(n) 

ii) neO(log,(n)) 

ii) n' eO(b") 

iv) b" O(n’) 

v) b"eO(n!) 

vi) n! ¢O(b"), 

如 果 函 数 了 对 某 些 自 然 数 > 有 js O(n") Rz, DAR SF 
是 有 界 多 项 式 (polynomially bounded) 。 尽 管 不 是 多 项 式 ， 但 
根据 例题 14. 2. 3 可 知 nlog, (n) 的 边界 是 多 项 式 刀 。 包 括 多 
项 式 在 内 的 有 界 多 项 式 函 数 是 函数 的 重要 组 成 部 分 ， 它 们 与 
有 效 算 法 的 时 间 复 杂 性 密切 相关 。 式 (iv) 和 式 (vi) 说 明 指数 
函数 和 阶乘 函数 不 是 多 项 式 边 界 的 。 根 据 定理 ,14.2. 2 和 定 
理 14.2.3 给 出 的 关系 ， 表 14-3 显示 了 大 0 的 层次 ， 按 照 增 
长 速度 给 出 了 一 个 函数 列表 。 在 标准 实践 中 ， 如 果 函 数 f 满 
足 2"e O(f)， 那 么 我 们 说 f 拥 有 指数 级 增长 (exponential 
growth) 。 根 据 这 个 惯例 ，n”" 和 n1 都 是 指数 级 增长 。 


那么 
表 14-3 大 O 的 层次 
大 0 渐 近 上 界 
O (1) 常数 
O (log, (n)) 对 数 
O (n) 线性 的 
O (nlog, (n)) nlogn 
O (m) 三 次 的 
O (n>) 三 次 的 
O (n) ANA (rz0) 
O (b") 指数 的 (b»1) 
O (n!) 阶乘 的 


一 个 算法 的 效率 通常 由 其 增长 速度 来 刻画 。 一 个 多 项 式 算法 是 指 它 的 复杂 性 是 多 项 式 边 界 的 。 也 
就 是 说 ， 对 于 某 些 rseN H c(n) seO(z)。 当 考虑 到 输入 规模 变 大 时 函数 的 增长 速度 时 ， 多 项 式 算法 
与 非 多 项 式 算法 之 间 的 区 别 非常 明显 。 表 14-4 列 出 了 一 个 复杂 性 不 是 多 项 式 的 算法 所 需要 的 庞 











大 资源 。 
表 14-4 几 个 普通 函数 的 增长 
n log; (n) n n? n? 2" n! 
5 2 5 25 125 32 120 
10 3 10 100 1,000 1,024 3,628,800 
20 4 20 400 8,000 1,048,576 2.4 .+ 10/5 
30 4 30 900 27,000 1.0 «10? 2.6 - 10? 
40 5 40 1,600 64 ,000 1.154015 8.1 - 10? 
50 5 50 2,500 125,000 I1 10» 3.0 - 10% 
100 6 100 10,000 1,000,000 1.2. «10? S10 
200 7 200 40 ,000 8,000,000 1.6 - 10% »107^4 





14.3 图 灵机 的 时 间 复 杂 性 


计算 的 时 间 复杂 性 度量 了 计算 要 承担 的 工作 量 。 图 灵机 计算 的 时 间 复 杂 性 通过 其 处 理 的 转移 的 数 
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量 来 度量 。 我 们 通过 分 析 一 个 接收 来 自 字符 表 | a,b| 的 回 文 的 机 器 M 的 计算 来 讨论 确定 图 灵机 时 间 复 
杂 性 要 考虑 的 问题 。 


a/a R 
b/b R 





B/B R 


M 的 计算 包含 一 个 用 于 比较 带 上 的 第 一 个 和 最 后 一 个 非 空 符号 的 循环 。 通 过 从 9, 开始 的 一 个 转 
K, 第 一 个 符号 被 记录 并 被 替换 为 空白 。 根 据 始 于 qi 的 路 径 ， 最 后 一 个 非 空 的 符号 被 检查 是 否 与 94 
或 者 q 匹配 。 然 后 机 器 通过 带 上 的 非 空 片断 移 到 左 侧 ， 同 时 比较 循环 将 会 重复 进行 。 当 状态 9, 或 者 
ds 读 到 空白 时 ， 那 么 该 字符 串 是 奇数 长 度 的 回 文 ， 能 够 在 状态 qs 被 接收 。 偶 数 长 度 的 回 文 在 状态 4 
被 接受 。 

M 对 符号 a AD 的 计算 是 对 称 的 。 当 处 理 字 符 a 时， 位 于 上 面 的 那 条 从 qi 到 gs 的 路 径 被 遍历 ; 
当 处 理 字符 b 时， 下 面 的 那 条 从 q 到 gs 的 路 径 被 遍历 。 表 14-5 列 出 的 计算 包含 了 所 有 长 度 为 0、1、 
2 和 3 的 字符 串 中 字符 的 重要 组 合 。 














表 14-5 M 的 计算 
长 度 0 长 度 1 长 度 2 长 度 3 
goBB qoBaB qo BaaB qo BabB qo BabaB qo BaabB 

H| Bq,B | Bq,aB 请 Bq, aaB | Bq, abB 片 Bq, abaB | Bq, aabB 
上 BBq,B |— BBq;aB | BBq,bB | BBq,baB I— BBq;abB 
|— BBBq,B | BBaq,B 上 BBbq,B | BBbq,aB FF BBaq, bB 
+ BBq,aB 片 BBq,bB + BBbaq,B | BBabq,B 
|— Bq,BBB FF BBbq,aB | BBaq,bB 

}— BBq, BB 上 BBq,bBB 

|— Bq; BbBB 

|}— BBq, bBB 

|— BBBq;BB 

| BBBBq,B 


就 像 我 们 期 望 的 那样 ， 这 些 计算 显示 ， 计 算 中 转换 的 数量 依赖 于 特定 的 输入 字符 串 。 实 际 上 ， 处 
理 相同 长 度 字符 串 的 工作 量 可 能 有 本 质 的 不 同 ， 图 灵机 的 时 间 复 杂 性 度量 了 处 理 特定 长 度 字 符 串 所 需 
要 的 最 大 工作 量 。 

定义 14.3.1 it M 是 一 个 标准 图 灵机 。M 的 时 间 复 杂 性 (time complexity) 是 一 个 函数 tcy: 
N-*N， 因 此 ， 当 使 用 长 度 为 于 的 字符 串 对 图 灵机 M 进行 初始 化 时 ，M 处 理 的 转换 数量 的 最 大 值 为 


tcu (n) s 
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当 度量 一 个 图 灵机 的 时 间 复 杂 性 时 ， 我 们 假设 图 灵机 的 计算 对 每 一 个 输入 字符 串 都 停机 。 试 图 讨 
论 一 个 不 确定 的 持续 计算 的 效率 或 者 更 精确 地 弥补 它 的 无 效 性 是 没有 意义 的 。 

定义 14. 3. 1 对 接收 语言 和 计算 函数 的 机 器 都 适用 。 用 类 似 的 方式 可 以 定义 确定 型 多 道 和 多 带 图 
灵机 。 我 们 将 会 在 下 一 章 讨论 不 确定 型 图 灵机 的 复杂 性 。 

我 们 对 时 间 复 杂 性 的 定义 度量 了 图 灵机 在 最 坏 情 况 下 的 性 能 。 我 们 选择 用 最 坏 情况 下 的 性 能 来 分 
析 一 个 算法 有 两 个 原因 。 一 个 原因 是 我 们 考虑 到 算法 计算 的 极限 。tcvw(n) 的 值 描述 了 当 使 用 长 度 为 n 
的 字符 串 对 图 灵机 M 进行 初始 化 时 ， 保 证 M 能 停机 的 最 小 资源 。 另 一 个 原因 是 严格 的 实效 ， 最 坏 情 
况 下 的 性 能 通常 比 平均 性 能 容易 度量 。 

我 们 使 用 M 接收 1a,b| 上 的 回 文 的 计算 来 说 明确 定时 间 复 杂 性 的 过 程 。 当 整个 输入 字符 串 被 用 空 
白 取代 或 者 发 现 第 一 个 不 匹配 的 字符 对 时 ，M 的 计算 终止 。 因 为 时 间 复杂 性 度量 了 最 坏 情 况 下 的 性 
能 ， 所 以 我 们 仅仅 需要 关心 那些 计算 会 导致 机 器 做 最 大 可 能 的 匹配 一 擦 除 循环 的 字符 串 。 对 M 而 言 ， 
当 输入 被 接收 时 这 个 条 件 得 以 满足 。 

基于 这 些 发 现 ， 我 们 可 以 通过 表 14-5 的 计算 得 到 函数 tc, (n) 的 初始 值 。 

tc, (0)? 

Ic Cb)y-3 

t6,(2):26 

fis (3) -10 
要 得 到 剩余 的 tcw 值 需要 对 M 的 计算 做 更 细致 地 分 析 。 我 们 首先 考虑 一 下 处 理 偶数 长 度 字 符 串 时 M 的 
行为 。 计 算 在 机 器 右 移 和 左 移 的 序列 中 转换 。 最 初 ， 带 头 处 于 临近 左 侧 非 空 片段 的 位 置 。 

。 向 右 移动 : 带头 向 右 移动 ， 擦 除 最 左 端 的 非 空 符号 。 读 人 字符 ER Fa ， HB o 

串 的 剩余 部 分 并 且 机 器 进入 状态 qu 或 者 状态 9),。 这 要 求 k+1 1 
次 转换 ， 此 处 大 指 带 上 非 空 部 分 的 长 度 。 

。 向 左 移 动 : M 向 左 移动 ， 擦 除 匹配 的 符号 ， 并 继续 通过 带 上 ? 
的 非 空 部 分 。 这 需要 次 转换 。 

上 述 的 活动 将 带 上 非 空 部 分 的 长 度 减 小 了 2。 这 个 比较 和 擦 除 的 
循环 会 一 直 重 复 执行 直到 带 空 为 止 。 正 如 以 上 所 述 ， 当 M 接收 输入 : 
时 ,偶数 长 度 的 字符 串 是 性 能 最 坏 的 情况 。 一 个 接收 长 度 为 n 的 字符 n 
串 的 计算 需要 执行 上 述 循环 n2 Ue. 

一 个 计算 所 需要 得 总 转换 次 数 可 以 通过 累计 每 次 兴 代 的 转换 获得 。 正 如 上 表 所 示 ， 一 个 长 度 为 偶 
数 n 的 字符 串 的 计算 所 需 转 换 的 最 大 次 数 是 从 1 到 n+1 的 自然 数 之 和 。 奇 数 长 度 字符 串 的 分 析 有 相同 
的 结果 。 因 此 ，M 的 时 间 复 杂 性 由 以 下 函数 来 定义 : 





3 


ot At Bt Bt BP RE oF 


一 


tcy(n) = >, i=(n+2)(n+1)/2€O(n’). 


例 14.3.1 一 个 双 带 图 灵机 M’ 


[a/aR, B/a R] [B/B S,.a/a L] [a/a L, a/a R] 
[b/bR, B/b R] [B/B S, b/b L] [b/b L, b/b R] 


" Q [B/B R, B/B R] ar S, B/B L] ar L, B/B R] ar R, B/B R] 


接收 字母 表 |a, b} 上 的 回 文 。M 的 一 个 计算 遍历 输入 ， 并 将 其 拷贝 到 带 2 上 ， 然 后 带 2 的 头 往 回 移 
动 到 位 置 0。 在 这 一 点 ， 带 头 移 过 输入 ， 带 1 自 右 向 左 且 带 2 自 左 向 右 地 比较 带 1 和 带 2 上 的 符号 。 
如 果 带 头 始终 没有 遇 到 不 同 的 符号 ， 那 么 输入 不 是 一 个 回 文 ， 计 算 中 止 并 且 图 灵机 拒绝 该 输入 字符 
串 。 当 输入 是 一 个 回 文 时 ， 计 算 停止 并 且 在 带 1 和 带 2 同时 读 到 空白 时 接收 该 输入 的 字符 串 。 

对 于 长 度 为 n 的 输入 ， 当 字符 串 是 回 文 时 产生 最 大 数量 的 转换 。 一 个 接收 的 计算 需要 三 个 完整 的 


izl 
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过 程 : 拷贝 、 重 绕 (rewind) 和 比较 。 通 过 计算 每 个 阶段 的 转换 数量 , 我 们 可 以 看 到 ，M' 的 时 间 复 杂 
性 是 te, (n) =3(n+1) +1, 口 

与 单 带 图 灵机 相 比 ， 双 带 图 灵机 的 一 个 转换 使 用 了 更 多 的 信息 并 且 实 施 了 更 为 复杂 的 操作 。 正 如 
接收 回 文 的 图 灵机 M 和 M' 的 复杂 性 所 示 ， 在 转换 的 复杂 性 和 必须 处 理 的 数目 之 间 存 在 一 个 权衡 。 
14.4 节 介 绍 了 单 带 图 灵机 和 多 带 图 灵机 时 间 复 杂 性 之 间 的 精确 关系 。 

确定 一 个 图 灵机 时 间 复 杂 性 的 第 一 步 是 识别 出 能 够 展示 最 坏 情况 下 的 行为 的 字符 串 。 在 接收 回 文 
的 图 灵机 中 ， 这 些 就 是 指 语言 中 的 字符 串 。 但 是 正如 下 面 例子 所 示 ， 情 况 也 并 不 总 是 这 样 。 

例 14.3.2 E M 是 一 个 双 带 图 灵机 


[x/x R, B/x R] [x/x L, B/B S] [x/x R, y/y L] 


[B/B R, B/B R] qm L, B/B S] P R, B/B L] e [B/B R, B/B L] 
Xu) 9) © © 


其 中 x 和 y 可 以 是 |a,b,c| 中 的 任意 字符 ,但 是 x 关 y。M 的 语言 包括 所 有 这 样 的 |a,b,c} EAE, 
它们 至 少 包含 一 个 值 x*， 使 得 字符 串 的 第 个 字符 和 倒数 第 k 个 字符 是 相同 的 。 例 如 ，abaa、abcccc 和 
abcbbc， 易 知 所 有 奇数 长 度 的 字符 串 都 属于 L(M)。 

M 的 计算 与 例 14.3. 1 中 的 图 灵机 采用 相同 的 策略 。 输 入 的 字符 串 被 拷贝 到 带 2 上 并 且 带 1 的 带 
头 返回 到 初始 位 置 。 随 着 带 1 的 带头 自 左 向 右 移动 和 带 2 的 带头 自 右 向 左 移动 ， 我 们 可 以 比较 带 1 和 
带 2 上 的 字符 。 当 两 个 带头 扫描 到 同样 的 字符 时 计算 停止 ， 输 入 字符 串 被 接收 。 

对 于 奇数 长 度 而 言 的 字符 串 ， 最 坏 的 情况 是 在 到 达 中 间 位 置 之 前 一 直 没 有 发 现 匹 配 的 字符 。 在 这 


种 情况 下 ， 一 个 长 度 为 n 的 字符 串 的 计算 需要 闻 (n +1) 次 转换 。 输 入 字符 串 被 M 拒绝 是 偶数 长 度 输 
入 的 性 能 最 坏 情况 。 在 一 个 拒绝 的 计算 中 , 带 1 的 带头 需要 三 次 扫描 整个 输入 ， 因 此 

Z (n+l) 如 果 nn 是 奇数 

3(n+1) ”如 果 n 是 偶数 

偶数 长 度 字 符 串 的 接收 最 多 需要 了 了 (n +2) 次 转换 ， 这 个 数字 永远 小 于 最 坏 情况 下 的 性 能 。 口 


14.4 复杂 性 和 图 灵机 的 变种 


第 8 章 介绍 了 图 灵机 模型 的 几 种 变化 从 而 来 简化 执行 复杂 计算 的 机 器 设计 。 在 可 判定 性 的 学 习 
中 ， 图 灵机 模型 的 部 分 是 不 相关 的 。 我 们 可 以 证 明 ， 任 何 使 用 某 个 图 灵机 结构 可 解 的 问题 对 于 其 他 图 
灵机 结构 也 都 是 可 解 的 。 然 而 ， 在 复杂 性 理论 中 存在 选择 问题 。14. 3 节 介 绍 的 接收 字母 表 la, bl 
上 的 回 文 的 机 器 展示 了 单 带 和 双 带 图 灵机 对 计算 资源 要 求 的 潜在 不 同 。 本 节 我 们 将 讨论 各 种 不 同 的 图 
灵机 模型 中 计算 复杂 性 的 关系 。 

定理 14.4.1 如 果 开 是 能 被 天道 确定 型 图 灵机 M 接收 的 语言 ， 那 么 M 的 时 间 复 杂 性 为 fev (nn)。 
Ast, 工 也 能 够 被 标准 图 灵机 M' 接 收 ， 且 时 间 复 杂 性 tes (n) =tcw(n)。 

WEBB: 本 证 明 的 依据 是 8. 4 节 介 绍 的 从 大 道 图 灵机 构造 单 道 图 灵机 的 内 容 。 单 道 图 灵机 的 字母 表 由 
M 的 带 字母 表 的 符号 元 组 组 成 。M 的 转换 的 形式 为 8(0gi zz) HRP x, oux, 是 道 1， 道 2，… 道 
k 上 的 字符 。M’ 的 相关 转换 形式 为 6(g;,[x,…,])， 其 中 的 上 元 组 是 M' 字 母 表 中 的 字符 。 因 此 ， 对 
于 每 一 个 输入 ，M 和 M' 所 处 理 的 转换 数量 都 是 相同 的 ， 因 此 teu = tewo L| 

定理 14.4.2. Ae X L 是 可 以 被 大 带 确 定型 图 灵机 M 接收 的 语言 ， 那 么 M 的 时 间 复 杂 性 tcw(m) = 
f(n), Ast, 工 可 以 被 标准 图 灵机 N 接受 ，N 的 时 间 复 杂 性 tcN(m) eO(( n?) 

WEBB: 从 k 带 图 灵机 构造 一 个 等 价 的 单 带 图 灵机 需要 使 用 一 个 2xk+1 道 图 灵机 M' 作 为 中 介 。 根 据 
定理 14.4. 1， 只 需 证 明 tcw e O(f(n)”) 即 可 。 

本 证 明 的 依据 是 8. 6 节 介 绍 的 能 够 模拟 多 带 图 灵机 行为 的 多 道 图 灵机 M' 的 构造 。 首 先 ， 我 们 分 析 


tcy (n) | 
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一 下 ,为 了 能 够 模拟 M 的 一 次 转换 ，M' 需 要 的 转换 的 次 数 。 

假设 我 们 模拟 M. 的 第 :次 转换 。 最 久远 的 情况 是 此 时 M 的 一 个 带头 正好 处 于 位 置 t。 模 拟 的 第 一 
个 步骤 是 记录 奇数 序号 带 上 的 被 偶数 带 上 的 开标 记 的 字符 。 这 个 步骤 由 以 下 几 个 M' 的 转移 序列 组 成 : 
二 





i 动 M' 转 移 的 最 大 次 数 
在 第 二 道上 找到 XX 并 返回 到 带 的 0 位 置 21 
在 第 四 道上 找到 X 并 返回 到 带 的 0 位 置 2t 
在 第 2k 道 上 找到 X 并 返回 到 带 的 0 位 置 2t 


在 找到 每 一 个 X 下 的 符号 以 后 ，M' 用 一 个 转换 记录 M 的 活动 。 因 此 M 的 一 次 转换 的 模拟 完成 
了 ， 如 下 所 示 : 





活 动 M' 转 移 的 最 大 次 数 
在 道 1 上 写字 符 ， 在 道 2 上 重新 布置 X， 返回 到 带 的 0 位 置 2(t+1) 
在 道 3 上 写字 符 ， 在 道 4 上 重新 布置 X， 返 回 到 带 的 0 位置 2(t+1) 
在 道 2k-1 上 写字 符 ， 在 道 2k 上 重新 布置 X， 返 回 到 带 的 0 位 置 2(t*1) 


因此 ,为 了 模拟 M 的 第 1 次 转换 ,M' 最 多 需要 Akt + 2k e Y 次 转换 。M' 的 计算 开始 于 一 个 转换 ， 
这 个 转换 在 奇数 序号 的 道上 放置 标记 并 且 在 第 2k+1 道上 放置 #。 其余 的 计算 则 由 模拟 M 的 转换 构成 。 
当 输 入 长 度 为 n 时 ,为 了 模拟 M 的 计算 ，M' 需 要 的 转换 次 数 的 上 界 是 ; 


fn) 


te, (n) <1 + Y (4kt «2k +1) e O(f( n)?). m 


14.5 线性 加 速 


图 灵机 M 的 时 间 复 杂 性 函数 tev(n) 给 出 了 当 输 入 长 度 为 n 的 字符 串 时 ， 一 次 计算 需要 的 转换 次 
数 的 上 界 。 本 节 我 们 将 介绍 接收 语言 工 的 图 灵机 可 以 被 “加 速 ” 从 而 能 够 产生 另外 一 个 能 够 比 原来 快 
倍增 常量 的 时 间 内 接收 工 的 机 器 。 

WM-(Q,X,D,q,8,F) 是 一 个 能 够 接收 语言 工 的 上 KK>1t) 带 图 灵机 。 下 面 关 于 加 速 的 策略 是 ， 
构造 一 个 机 器 N， 使 其 能 够 接收 工 并 且 N 的 6 个 转换 能 够 模拟 M 的 m 个 转移 ， 其 中 mm 根据 需要 加 速 
的 程度 决定 。 例 如 ， 选 择 m=12 大 约 能 够 减少 一 半 的 转换 次 数 ， 因 为 N 的 6 次 转换 可 以 达到 与 M 的 
12 次 转换 相同 的 效果 。 此 处 提 到 大 约 ， 是 因为 IN 需要 的 某 些 初始 化 开销 比 模拟 M 的 计算 有 优势。 

因为 机 器 M 和 机 器 N 接收 相同 的 语言 ， 所 以 N 的 输入 字母 表 也 是 并。N 的 带 字母 表 包括 M 的 带 
字母 表 、 符 号 # 以 及 T 的 所 有 排序 的 m 元 组 字符 。N 的 一 次 计算 包括 两 个 阶段 ， 初 始 化 和 模拟 。 初 始 
化 将 输入 转换 为 一 个 m 元 组 序列 。N 的 计算 的 其 余部 分 为 模拟 M 的 计算 。 

在 模拟 M 的 计算 的 过 程 中 , N 的 一 个 带 字符 是 M 字符 的 一 个 m 元 组 ,，N 的 状态 用 于 记录 那些 可 
能 被 M 的 后 续 m 个 转移 影响 的 M 的 带 。 在 N 计算 的 这 个 阶段 ， 其 一 个 状态 由 以 下 几 部 分 组 成 。 


i) M 的 状态 ; 

ii) 从 i=1 到 i=k，N 的 带 i 上 目前 被 扫描 的 m 元 组 以 及 紧 临 其 左右 的 mw 元 组 ; 

ii) 一 个 排序 的 大 元 组 [站 ,区 ， 其中, i, 是 指 在 正 被 N 扫描 的 m 元 组 中 的 带 j 上 正在 被 M 扫描 
的 字符 的 位 置 。 


N 的 6 个 转换 序列 使 用 状态 信息 来 模拟 M 的 m 个 转移 。 

这 个 过 程 可 以 通过 使 用 例 14. 3. 1 中 的 双 带 图 灵机 M' 来 展示 ;， 即 m=3 HAX abbabba, N 的 输 
和 人 配置 与 M' 相 同 ， 其 中 带 1 和 带 2 上 的 输入 字符 串 全 部 为 空白 。N 的 第 一 个 活动 是 将 输入 字符 串 编码 
为 m 元 组 。 这 个 过 程 开始 于 在 两 个 带 的 0 位 置 写 人 字符 #。 根据 带 1 上 每 三 个 连续 的 字符 ,在 带 2 上 
写 人 一 个 排序 的 三 元 组 。 由 于 Babbabba 的 长 度 不 能 正好 被 3 整除 ， 所 以 带 2 上 有 一 个 排序 的 三 元 组 可 
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用 空白 追加 。 重 新 将 N 的 带头 布置 在 位 置 1， 并 将 原来 的 输入 字符 串 从 带 1 上 擦 除 。 在 后 续 的 计算 中 ， 
我 们 将 用 N 的 带 2 模拟 M' 的 带 1,， FN 的 带 1 模 拟 M' 的 带 2。 
下 图 显示 了 输入 为 abbabba 时 M' 的 初始 化 配置 和 N 在 编码 后 的 配置 。 





初始 化 后 ，N 的 带 上 的 每 一 个 空白 将 会 用 于 放置 M' 的 被 编码 的 空白 [BBB]。 为 了 在 图 中 显示 出 不 
同 ， 我 们 把 N 的 空白 记 为 B。 在 对 输入 进行 编码 后 ，N 将 会 进入 以 下 状态 : 
(455? , [ BBB] ,?;?, [Bab] ,?;[1,1]). 
m 元 组 [B88] 和 [Bab] 是 带 1 和 带 2 上 的 当前 分 别 正 被 N 扫描 的 m 元 组 。 有 序 对 [1, 1] 显示 了 
在 NN 当前 的 状态 中 ，M' 的 计算 正在 扫描 每 一 个 三 元 组 [BBB] 和 [Bab] 的 第 一 个 位 置 。 符 号 ? BA 
位 符 ， 后 续 的 转换 将 导致 N 进入 新 的 状态 ， 这 些 状态 中 ， 符 号 ? 被 与 当前 正 被 扫描 的 三 元 组 向 左 和 右 
的 位 置信 息 替 换 。 
根据 处 理 abbabba 的 过 程 中 M' 和 NN 获取 的 配置 ， 下 图 展示 了 M' 的 m 个 动作 的 模拟 。 


w | | [eJe[ele|o[a] | | w [e]ton]ton [vom] | 


Lejeje[ejs[o| [ | | | # [tezen | tae) | ten] B 


进入 这 样 的 配置 后 ，N 的 状态 是 : 
(q3?,[ BBb],?;7,[ bBB],?;[3,1]). 

状态 中 有 序 对 [3 ,1] 说 明 M' 的 计算 正在 读 带 1 上 三 元 组 [BBb] 中 的 5b 和 带 2 上 三 元 组 [58B] 中 的 b, 

随后 ， 机 器 N 在 每 条 带 上 左 移 ， 扫 描 方 格 ， 然 后 进入 状态 

(gs;#,[ BBb],?;[ bab],[bBB],?;[3,1]), 
这 个 状态 记录 了 原来 状态 中 被 扫描 方 格 左边 的 三 元 组 。# 的 角色 是 保证 在 这 个 模拟 阶段 中 N 不 会 越过 
带 的 左 侧 边界 。 向 右 的 两 次 移动 会 使 N 进入 状态 
(qs;#,[ BBb] ,[ bab] ;[ bab] ,[ BBB] ,[ BBB] ;[3,1]) , 

这 个 状态 记录 了 原来 被 扫描 位 置 的 右边 的 三 元 组 。 随 后 N 向 左 移动 其 带头 到 原来 的 位 置 。 这 些 转换 之 
Ja, N 的 状态 包括 了 M' 中 可 能 被 三 个 转移 改变 的 带 的 片段 的 拷贝 。 

此 时 ，N 重新 写 带 以 便 与 M' 在 三 个 转移 后 即将 进入 的 配置 相 匹 配 ， 
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并 且 进 入 以 下 状态 以 便 开 始 模拟 M' 接 下 来 的 三 个 转移 。 

(45;?,[BBb],?;?, [bBBB] ,?5[3,1]) 
由 于 N 的 每 个 带 方 格 有 M' 的 三 个 字符 ， 所 以 M' 能 够 被 三 个 转换 所 改变 的 带 包含 在 当前 被 N 所 扫描 的 
WIP, 并且 也 被 包含 在 紧邻 正在 扫描 的 方 格 的 左 侧 或 者 右 侧 的 带 方 格 中 ， 而 不 是 两 侧 都 包括 。 因 
此 ，N 为 了 更 新 它 的 带 和 准备 继续 模拟 M' 最 多 只 需要 两 个 转换 。 对 M' 的 模拟 会 一 直 持 续 到 M' 停 机 ， 
在 这 种 情况 下 N 也 会 停机 并 且 返 回 跟 M' 相 同 的 组 成 状况 。 

定理 14.5.1 设 M 是 接收 语言 工 的 上 带 图 灵机 (k>1)， 其 时 间 复 杂 性 函数 为 teuln) =f(n)。 
对 于 任何 一 个 常数 c>0， 都 存在 一 个 k 带 图 灵机 NN 能 够 接收 LL 并 且 N 的 时 间 复 杂 性 函数 Ie (n) < 
[cfln) ] «2n «3, 

WEBB: 我 们 刚刚 讨论 过 对 的 构造 。 把 长 度 为 n 的 输入 字符 串 编码 成 m 元 组 和 重新 布置 带头 的 位 置 
需要 2n+3 次 转换 。 

N 剩余 的 计算 主要 是 模拟 M 的 计算 。 为 了 获取 和 记录 模拟 M 的 m 次 转换 所 需要 的 信息 ， 机 器 N 
执行 一 次 左 移 、 两 次 右 移 和 一 次 重新 将 带头 布置 到 原来 位 置 的 操作 。 重 新 配置 N 最 多 需要 两 次 转换 。 
N 的 这 六 个 转换 对 于 产生 与 M 的 m 个 转移 相同 的 结果 来 说 足够 了 。 选 择 ma 6/c, W 

tc, (n) =[ (6/m)f(n) | +2n +3 
<|cf(n) ]+2n+3 
定理 得 证 。 图 

推论 14.5.2 jk M 是 能 够 接收 语言 L 的 单 带 图 灵机 ,其 时 间 复 杂 性 teu (n) =f(n)。 对 于 任何 一 
个 常数 c>0， 都 存在 一 个 双 带 图 灵机 NN 能够 接收 工 且 其 时 间 复 杂 性 tcy(n) 志 [cf(n)|]+2n+3。 

. WEBB: 在 标准 行为 中 ， 单 带 图 灵机 M 可 以 被 认为 是 一 个 在 计算 中 没有 使 用 第 二 条 带 的 双 带 图 灵 
Hlo EM 14. 5.1 可 以 用 于 加 速 这 个 双 带 图 灵机 。 m 

定理 14. 5. 1 中 加 速 的 代价 是 创建 一 个 更 大 的 字母 表 和 大 范围 地 增加 状态 的 数量 。 精 确 地 确定 这 
些 集合 的 大 小 将 留 作 练习 。 

14.6 语言 时 间 复 杂 性 的 属性 

时 间 复 杂 性 函数 tew 的 定义 在 机 器 M 而 不 是 该 机 器 接收 的 语言 中 显示 。 我 们 知道 ， 可 以 构造 许多 
不 同 的 机 器 接收 同样 的 语言 ， 而 每 一 个 机 器 都 可 能 有 不 同 的 时 间 复 杂 性 。 我 们 可 以 说 ， 如 果 存 在 一 个 
标准 的 《〈 单 带 的 确定 型 ) 图 灵机 M 其 时 间 复 杂 性 te. (n) e OCfC n) )， 则 语言 工 被 在 一 个 确定 的 时 间 
fo) 内 接收 。 根 据 上 一 节 的 结果 我 们 可 以 得 知 ， 无 论 是 否 存在 一 个 接收 工 的 时 间 复 杂 性 是 O(f(n) ) 的 
SiR RL, ia LRE O(f(n)’). 

本 节 我 们 将 要 介绍 语言 时 间 复 杂 性 边界 的 两 个 有 趣 的 结果 。 首 先 ， 我 们 将 会 介绍 对 于 任何 可 计算 
全 函数 作 n)， 都 存在 一 个 时 间 复 杂 性 不 在 边界 An) 内 的 语言 。 然 后 我 们 介绍 存在 这 样 的 语言 ， 对 它 
们 而 言 不 存在 “最 好 ”地 接收 它们 的 图 灵机 。 定 理 14. 5. 1 已 经 说 明了 一 个 接收 某 种 语言 的 机 器 可 以 
被 线性 地 加 速 。 然 而 ， 这 个 处 理 过 程 不 能 改变 该 接收 机 器 的 增长 速度 。 我 们 将 会 介绍 存在 这 样 一 些 语 
言 ， 它 们 可 以 被 任意 的 机 器 接收 ， 同 时 也 能 被 时 间 复 杂 性 与 原来 的 机 器 相 比 按照 非常 小 的 速率 增长 的 
机 器 接收 。 

这 些 结果 都 利用 了 编码 和 列举 所 有 多 带 图 灵机 的 能 力 。 一 个 单 带 图 灵机 在 ”字符 编码 
对 10, 1] 上 的 字符 串 的 编码 已 经 在 11. 5 节 介 绍 过 了 。 这 种 方法 可 以 扩展 到 为 ”0 1 
所 有 输入 来 自 字 母 表 10; 1] 的 多 带 图 灵机 编码 。 带 字母 表 应 该 包括 元 素 10， ! u 
1,B,x, ,…,X,|。 带 字符 按照 以 下 原则 编码 : 3 iM 

像 前 面 一 样 ， 一 个 数字 被 编码 为 它 的 一 元 表示 ， 一 个 通过 编码 元 素 的 转换 。“” Er 
由 0 A> Bia; 5595555545 BE 00 分 隔 s 根据 这 些 规则 ;一 个 带 图 灵机 可 以 被 
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000 KO000en( 接收 状态 )000en( 转 换 )000， 
其 中 , 是 上 的 一 元 表示 ，en 表示 对 圆 括号 内 的 内 容 编码 。 

根据 这 些 表示 法 ， 每 一 个 字符 串 we 10, 1] “都 可 以 被 看 作 是 某 个 多 带 图 灵机 的 编码 。 如 果 u 不 
满足 编码 一 个 多 带 图 灵机 的 语法 条 件 ， 那 么 这 个 字符 串 被 解释 为 一 个 单 带 单 状态 并 且 没 有 转换 的 图 灵 
机 的 表示 。 

在 练习 8. 32 中 构造 了 一 个 列举 所 有 10,1} 上 的 字符 串 的 图 灵机 E。 由 于 每 一 个 字符 串 也 可 以 表示 
一 个 多 带 图 灵机 ， 机 器 也 也 可 以 被 等 同 地 看 作 列举 所 有 输入 字母 表 为 10,1| 的 多 带 图 灵机 。E 列举 的 
字符 串 记 做 w ,ww ,ww,…， 相 应 的 机 器 记 做 Mo M, ,M, ,…。 

现在 ,我 们 介绍 语言 的 时 间 复 杂 性 没有 上 界 。 更 精确 地 说 ， 对 于 任意 的 可 计算 函数 1， 我 们 都 能 
构造 一 个 递归 语言 L， 使 得 不 存在 时 间 复 杂 性 te, (0) <f(n) 的 图 灵机 M 能 够 接收 L。 证 明 方法 是 , 使 
用 对 角 化 来 获得 存在 这 样 一 个 图 灵机 的 假设 存在 矛盾 。 

定理 14.6.1 设 f 是 一 个 人 金 函 数 ， 那 么 存在 一 个 语言 L 使 得 对 于 任何 接收 工 的 确定 型 图 灵机 M， 
ttu Af AAR., 

证 明 : i FEARAS BEL. HBA L- (u| 在 f(n) 或 更 少 步 骤 内 M, RM u,n = 
length(u;) | , 36, 我 们 说 明 工 是 递归 的 , 所 以 任何 一 个 接收 工 的 机 器 转移 的 次 数 都 不 能 以 f(n) 为 
边界 。 

一 个 接收 工 的 机 器 M 的 描述 如 下 。M 的 输入 是 10;,1j ”上 的 字符 串 us 我 们 再 次 强调 字符 串 u K 
示 的 是 列举 所 有 多 带 图 灵机 的 图 灵机 M, 的 编码 。M 的 一 个 计算 

1. 判定 u, WARE, Bil length(u;) =n; 

2. 模拟 F 的 计算 以 确定 f(n)。 | 

3. 在 wu 上 模拟 M, 直到 M, 停机 或 者 在 此 之 前 完成 fn) 个 动作 ; 

4. 如 果 M, 停机 没有 接收 u RA M, 没 能 在 前 f, 个 转换 内 停机 ， 那 么 M 接收 ;否则 拒绝 uo 
显然 , 语言 L(M) 是 递归 的 ， 因 为 第 3 步 保 证 了 每 个 计算 都 会 终止 。 

由 于 我 们 这 样 设计 语言 L， 因 此 对 角 化 和 自 引 用 可 以 被 用 于 为 M 能 够 被 一 个 时 间 复 杂 性 边界 为 
f(n) 的 图 灵机 接收 的 假设 产生 一 个 矛盾 。 设 M 是 任意 一 个 能 够 接收 世 的 图 灵机 。 那 么 在 列举 图 灵机 
的 某 处 可 能 出 现 M， 也 就 是 说 M = Mi。 我 们 可 以 通过 工 中 七 的 成 员 资格 来 获取 自 引 用 。 因 为 LUMD ) 
=L, M, El u, 当 且 仅 当 M, 在 f(n) 或 更 少 的 转换 内 停机 ， 或 者 M, 没 能 在 前 f(n) 个 转换 内 停机 。 

通过 矛盾 证 明 M, 不 以 f 为 边界 。 假设 M, 以 了 为 边界 并 且 设 n=length(u,)。 需 要 考虑 两 种 情况 : 
u; eL Alu, £L. 

Al u, e L, 那么 M 在 f(n) 或 更 少 的 转移 内 接收 (因为 假设 M, 以 /为 边界 ) 。 但 是 ， 正 如 前 面 
指出 的 ，M 接收 uw 当 且 仅 当 M, 没有 接收 或 者 Mj 在 f(n) 或 更 少 的 转换 内 停机 。 

如 果 wu geL, IA M, 的 计算 在 f(n) 个 步骤 内 停机 并 且 不 接收 ww。 在 这 种 情况 下 ,根据 工 的 定义 有 
u eL, 

在 以 上 任意 一 种 情况 下 ， 假 设 M) 以 f 为 边界 都 会 导致 巴 盾 。 因 此 ， 我 们 可 以 得 出 结论 ， 任 意 一 个 
接收 语言 L 的 机 器 都 不 以 了 为 边界 。 m 

接 下 来 我 们 介绍 存在 一 种 不 存在 能 够 接收 它 的 最 快 的 机 器 的 语言 。 为 了 说 明 这 种 情况 是 如 何 发 生 
的 ， 我 们 考虑 一 个 机 器 的 序列 N,N, ,…. 都 能 接收 同样 来 自 0 "的 语言 。 证 明 使 用 了 函数 +， 其 定义 
如 下 : 

i) lj 

ii) t(n) s2**^" 

由 此 可 得 ,t(2) =2 (3) =22 ,t(n) 是 一 系列 n 个 2 的 指数 。 当 运行 输入 0 时 , 表 14-6 EMBL) A 
出 了 机 器 N, 的 转换 次 数 。 位 置 [i, 姑 处 的 “表示 这 个 计算 的 转换 次 数 是 不 相关 的 。 
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514.6 机 器 N, 及 其 计算 








如 果 机 器 存在 这 样 一 个 序列 ， 那 么 
tcy (n) * log, (tey, (n) ) 
对 于 所 有 n=i+1 都 成 立 。 因 此 ， 我 们 有 一 个 机 器 序列 能 够 接收 同样 的 语言 ,并 且 序 列 中 的 每 一 个 机 器 
与 其 前 趋 相 比 都 有 一 个 更 小 的 增长 速度 。 定 理 14. 6. 2 构造 了 一 个 语言 言 ,这 个 语言 具有 “能 够 总 是 被 更 
高 效 地 接受 "的 属性 。 

在 开始 部 分 的 讨论 和 定理 14. 2.6 的 构造 中 都 是 用 到 了 ， 当 输 入 任意 增 大 时 ， 增 长 速度 能 够 度量 
函数 性 能 的 属性 。 根 据 表 14-6 中 的 模式 可 以 看 出 ， 我 们 仅仅 在 输入 字符 串 长 度 为 i+2 或 者 更 大 时 才 
比较 机 器 N, 和 Nia 的 计算 。 

定理 14. 6.2 ”存在 一 种 语言 工 ， 使 得 对 于 任意 接收 工 的 机 器 M， 都 存在 另外 一 个 能 够 接收 工 并 且 
时 间 复 杂 性 为 te, (n) sO(log:(tcw(z)) ) 的 机 器 M'。 

设 1 是 递归 定义 的 函数 ， 如 前 所 述 ， 当 n>1 时 , 1(1) =2 A t(n) 227», 构造 一 个 满足 下 面 两 
个 条 件 的 递归 语言 LC {01*。 

1. 如 果 M, 接收 L， 那 么 对 于 所 有 大 于 ni 的 mtcw (n) 21(n - i) RI. 

2. 对 于 每 个 k， 存 在 一 个 图 灵机 M, 使 得 L(M,) =L 并 且 对 于 所 有 大 于 nn 的 n fy (n) &t(n - k) 
均 成 立 。 

假设 构造 了 一 个 满足 上 述 条 件 的 L， 那 么 对 于 任意 接收 LL 的 机 器 M,， 都 存在 一 个 同样 接收 的 机 
器 M, 并 且 其 时 间 复 杂 性 

tcu (n) e O(log, (te, (n))) ， 
Wkoiel RARTE2 fée — Beli L 的 机 器 M, 且 其 时 间 复杂 性 tcy (n) <t(n -i-1) ,其 中 n>n,。 
然而 ,根据 条 件 1 
Ic, (n) Zt(n-i) n»n, 
结合 以 上 两 个 不 等 式 和 上 的 定义 可 得 
IG (n) atn- g2 SaN EEn > max|n,,n,|. 
也 就 是 说 ,对 于 所 有 的 于 > max [n;,n,] tey (n) Slog, (tcy, (n) ) 均 成 立 。 

现在 我 们 定义 语言 工 的 构造 。 按 照 顺 序 ， 我 们 首先 定义 字符 串 0"( =1 ,2,…') 是 否 属 于 语言 L。 在 
这 个 构造 过 程 中 ， 图 灵机 列举 序列 Mo ,M, , M,… 中 的 图 灵机 被 标记 为 取消 。 在 判定 是 否 0" s 工 时 ,我 
们 要 检查 一 个 图 灵机 Ms ， 此 处 8(z) 是 范围 0，…,， n 中 的 最 后 一 个 值 j。 因 此 

i) M, 之 前 从 未 被 取消 过 ， 

ii) ty (n) <t(n-j). 

当 g(n) 没 有 定义 时 这 样 的 值 j 也 可 能 是 不 存在 的 。 字 符 串 0" esL， 当 且 仅 当 g(m) 被 定义 并 且 Ms 不 
接收 0"。 如 果 g(n) 被 定义 了 ， 那 么 M,,, 被 标记 为 取消 。L 的 定义 保证 了 一 个 取消 的 机 器 不 能 接收 工 。 
WR Msm 被 取消 了 , 那么 0" eL 当 且 仅 当 Mn) 不 接收 0"。 因 此 , L(M,,, ) #Lo 

定理 14. 6.2 的 证 明 包含 了 以 下 三 个 引 理 。 第 一 个 引 理 说 明 工 是 递归 的 ， 后 面 两 个 引 理 说 明 L 满 
足 上 述 的 条 件 1 和 条 件 2。 

引 理 14.6.3 语言 工 是 递归 的 。 

WEBB: L 的 定义 提供 了 一 种 判定 0" eL 是 否 成 立 的 方法 。 如 果 g(n) 存 在 ， 对 于 0” 的 判定 过 程 开 
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始 于 确定 满足 条 件 1 和 条 件 2 的 机 器 序列 M, =, M, 中 的 第 一 个 机 器 的 索引 8g(z) 。 为 了 做 到 这 一 
点 ， 在 分 析 输 入 入 ，0，…，0"” 时 有 必要 确定 序列 Mu，…，M; ,中 的 机 器 被 取消 。 这 就 要 求 我 们 使 
用 适当 的 1 值 比较 表 14-7 中 的 函数 复杂 性 。 输 入 字母 表 包 括 独立 的 字符 0， 因此 可 以 通过 模拟 输入 为 
0" 时 M, 的 计算 来 确定 few (m) o 


表 14-7 确定 取消 机 器 的 计算 





输入 m 比较 tev (m) <t(m - i) 
0 tem (0) <1(0 -0) =t(0) 
0 1 teu, (1) St(1 -0) 2 (1) 
Icy, (1) &t(1 71) =2(0) 
00 p Icy (2) «t(2 -0) TEA] 


tey (2) &t(2 -1) =t(1) 
tcm, (2) <t(2 -2) -t(0) 


red n-1 tcu (n 1) &t(n-1-0) =t(n-1) 


Icy, (n - 1) &t(n -1 -1) =t(n-2) 
Icy, (n 71) &t(n -1 -2) =t(n-3) 


teu, (n7 1) &t(n-1- (n-1)) =1(0) 


在 记录 了 被 取消 的 机 器 后 ， 我 们 用 输入 为 0" 的 计算 来 确定 g(n)。 从 j=0 开始 ， 如 果 M 之 前 没 
有 被 取消 ， 那 么 就 计算 攻关 -站 并 且 模 拟 输入 为 0 时 M, 的 计算 。 如 果 tcw (n) «t(n -J) , 那么 g(n) =jo 
否则 ， 增 加 j 并 循环 执行 比较 直到 找到 g(n) 或 者 所 有 的 机 器 M,,... M, 都 被 测试 过 。 

如 果 g(n) 存 在 ,使 用 输入 0" 运行 机 器 M,.,,。 计 算 的 结果 能 够 确定 0" FE ARE L 的 成 员 : 0” eL 
且 仅 当 Ms 不 接收 0"。 上 述 过 程 描 述 了 一 个 判定 任意 字符 串 0” 是 否 属于 工 的 过 程 。 因此, L 是 递 
归 的 。 T 

3|38 14.6.4 Li E 44, 

证 明 : 假设 M, 接收 L。 首 先 , 值得 注意 的 是 存在 某 个 整数 p;， 使 得 如 果 一 个 机 器 M, ,Mi,…,M,; 
从 未 被 取消 ， 那 么 取消 它 的 优先 级 比 前 者 字符 串 0” 的 优先 级 要 高 。 因 为 序列 My ,M, ,…,M; 中 被 取消 
的 机 器 的 数量 是 有 所 限制 的 ， 因 此 我 们 可 以 不 知道 p; 的 值 , 但 是 它 必然 会 发 生 ， 这 也 是 我 们 需要 知道 
的 全 部 内 容 。 

对 于 任意 的 0"， FB n KF p, 和 i 的 最 大 值 ， 不 存在 可 以 被 取消 的 Mi(k<i)。 假 设 tev (n) < 
t(n 一 i)， 那 么 在 检查 0” 时 M, 将 被 取消 。 然 而 ,一 个 被 取消 的 图 灵机 不 能 接收 L。 因 此 对 于 所 有 n» 
max |p;, i} 都 有 tcw(n) 宇 1(n 一 让 成 立 。 m 

引 理 14.6.5 L 满足 条 件 2。 

证 明 : 我 们 必须 证 明 ， 对 于 任意 整数 k, 存在 一 个 接收 世 的 机 器 M 并 且 teuln) <t(n - k) XEBUR 
大 于 某 个 nn 的 n 都 成 立 。 我 们 先 从 引 理 14.6. 3 描述 的 接收 LL 的 图 灵机 M 开始 。 为 了 判定 0” 是 否 属于 
工 ， 机 器 M 需要 确定 8(n) 的 值 并 且 模 拟 M,,, 在 输入 0"” 上 的 计算 。 为 了 获取 g(n)，M 必须 确定 在 分 
析 字 符 串 入 ,0,…，0” 时 Mi 中 的 哪些 被 取消 了 。 不 幸 地 是 ， 表 14-7 中 给 出 的 这 些 情况 的 直接 度量 需 
BEF n-k) KRM, l 

正如 引 理 14. 6.4 所 述 ， 当 考虑 到 初始 输入 序列 入 ;0 ,00,…,0%* 时 ， 任 意 一 个 之 前 从 未 被 取消 的 图 
灵机 Mi (i<k) 会 被 取消 。 这 个 p, 值 可 用 于 推导 前 面 所 说 的 计算 的 复杂 性 。 对 于 每 一 个 mpi ,0” 是 
否 被 接收 的 信息 存储 在 接收 工 的 机 器 M 的 状态 中 。 

机 器 M 在 输入 0” 上 的 计算 可 以 分 为 两 种 情况 : 

第 一 种 情况 : n<p,. 0" 是 否 属于 工 仅 通过 M 状态 记录 的 信息 来 决定 。 
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第 二 种 情况 : n» ps 第 一 个 步骤 是 确定 g(n) ， 通 过 模拟 输入 为 0"(m =k+1,…,n) 时 图 灵机 M, 
(i=k+1,…,n) 的 计算 来 确定 M, ETE OO 上 或 者 0" 之 前 被 取消 。 因 为 Mo,M, ,…,M, 中 的 任何 机 器 
不 会 被 输入 长 度 大 于 pi 的 输入 取消 ， 所 以 我 们 只 需要 检查 在 范围 Mi,i ,…,M, 内 的 机 器 就 可 以 了 。 

跳 过 模拟 Mo,M ,---,M, 的 能 力 能 够 减少 度量 输入 字符 串 O (n » p). 所 需要 的 转换 次 数 。 表 14-7 给 
出 的 模拟 数字 被 减少 到 如 下 表 所 示 。 








输入 m 比较 tem (m) &t(m - i) 
oft! k+1 Icy, ,,(Kk+1) <t(k+1—-(k+1)) =1(0) 
or k+2 tem, ,, (kK +2) <t(k+2 - (k*1)) =1(1) 


Icy, (Kk +2) <t(k+2 -(k+2)) =1(0) 


Q^ n tem, (0) &t(n - (K&1)) 
Icy, , 4 (n) &t(n - (k*2)) 


Icy, (n) <t(n-n) -t(0) 





检查 当 输 入 为 0” 时 M, 是 否 被 取消 最 多 需要 (m -i) 次 转换 。 前 面 序列 中 任意 一 个 计算 所 需要 最 
多 转换 的 情况 发 生 在 i=k+1 且 m=n 时， 此 时 转换 的 最 大 次 数 是 t(n-k-1). 

机 器 M 必须 实施 给 出 的 每 一 个 比较 。 模 拟 输 入 为 0” 时 M, 的 计算 最 多 需要 1(n -大 - 1) 次 转换 。 
模拟 后 擦 除 带 和 准备 后 续 的 模拟 在 另外 21(n -— k - 1) 次 转换 内 可 以 完成 。 模 拟 和 比较 循环 必须 在 每 一 
个 机 器 M,( i=k+1,…,n) 的 输入 0"(m=k+1,…,n) 上 重复 。 这 样 ， 模 拟 过 程 最 多 重复 (n - k) (n- 
k+1)/2 次 。 因 此 ，M 所 需要 的 转换 次 数 少 于 3(n 一) (nk+1)1(n -kk-1)/2 次 。 也 就 是 说 ， 

tc, (n) x3(n-k)(n-k«1)t(n-k-1)72. 
Am, 3(n -k) (n-k*1)t(n-k-1)/2 的 增长 速度 小 于 区 za- k) 227" gH IRE, DRUG, feu (n) < 
(n-k) 对 所 有 大 于 某 个 屎 的 n 都 成 立 。 E 

ERER TOT ERB L 的 机 器 M， 都 存在 一 个 机 器 M' 能 够 比 M 更 高 效 地 接收 工 。 现 
在 M' 接 收 L 所以, 再 次 通过 定理 14. 6.2 可 知 存在 一 个 能 够 更 高 效 地 接收 工 的 机 器 M“。 这 个 过 程 
可 以 不 确定 地 持续 下 去 ， 从 而 产生 一 系列 机 器 ， 其 中 的 每 一 个 机 器 与 其 前 驱 机 器 相 比 ， 都 能 以 更 小 的 
增长 速度 接收 工 。 

定理 14. 6. 2 揭示 了 算法 计算 的 不 直观 的 属性 ; 存在 没有 最 优 解 的 判定 问题 。 给 定 一 个 问题 的 任 
意 一 个 算法 解 ， 都 存在 另外 一 个 比 它 的 效率 明显 提高 的 算法 解 。 


14.7 计算 机 计算 的 模拟 


我 们 关于 算法 复杂 性 的 研究 是 基于 图 灵机 在 实现 一 个 算法 的 计算 时 所 需要 的 转换 次 数 。 然 而 ,我 
们 所 作 的 绝 大 部 分 计算 工作 并 不 在 图 灵机 上 而 是 在 计算 机 上 。 为 了 说 明 图 灵机 计算 分 析 的 实际 应 用 ， 
我 们 将 在 本 节 比 较 在 一 个 标准 计算 机 和 一 个 图 灵机 上 运行 同一 个 算法 的 时 间 复 杂 性 ， 此 处 计算 机 计算 
的 时 间 复 杂 性 是 通过 计算 过 程 中 机 器 执行 的 指令 数 来 度量 的 。 

我 们 不 会 推导 有 关 指 令 数 和 转换 次 数 之 间 精 确 关 系 的 定理 。 因 为 不 同 的 计算 机 有 不 同 的 体系 结 
构 、 指 令 系 统 、 存 储 容量 和 计算 能 力 ， 所 以 推导 这 样 的 精确 关系 是 不 可 能 的 。 然 而 ， 我 们 要 做 的 是 ， 
定义 一 种 通用 的 、 包 含 了 标准 机 器 或 继承 语言 的 机 器 指令 。 实 际 上 ， 我 们 赋予 这 种 指令 的 弹性 和 计算 
能 力 比 任何 实际 应 用 的 计算 机 体系 结构 中 的 指令 都 要 强 。 

首先 值得 注意 的 是 ， 我 们 研究 的 兴趣 是 一 个 实际 的 计算 机 而 不 是 理论 机 器 ， 如 图 灵机 。 因 此 ,我 
们 的 机 器 必须 有 有 限 的 存储 。 存 储 可 以 想 多 大 就 多 大 ， 但 是 是 有 限 的 。 机 器 存储 被 划分 为 固定 长 度 的 
有 地 址 的 字 。 在 实际 应 用 中 ， 一 个 字 通 常 包括 32 或 者 64 位 ,但 是 在 我 们 的 机 器 中 ， 人 允许 字 的 长 度 是 
任意 固定 的 长 度 。 关 于 字 长 惟一 的 约束 是 它 要 足够 长 以 便 能 够 容纳 机 器 指令 。 每 一 个 字 都 有 一 个 相关 
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的 数字 地 址 用 于 检索 和 存储 数据 。 

一 个 机 器 指令 由 说 明 要 执行 的 操作 的 操作 码 和 操作 数 构成 。 指 令 可 以 移动 数据 、 执 行 算 术 或 布尔 
运算 、 调 整 程序 流 或 者 分 配额 外 的 存储 。 临 时 的 计算 或 动态 增加 计算 中 可 用 的 存储 可 以 请 求 存储 分 
配 。 我 们 假设 存在 一 个 最 大 的 存储 ， 也 就 是 说 ， 一 个 独立 指令 的 运行 可 以 分 配 m, 个 字 。 当 然 ，m。 这 
个 数字 可 以 跟 我 们 希望 的 一 样 大 。 

操作 数 指明 在 什么 位 置 检索 数据 ,在 什么 位 置 存储 结果 ， 或 者 其 他 操作 需要 使 用 的 地 址 。 一 个 指 
令 通 常 有 一 个 或 者 两 个 操作 数 ， 但 是 我 们 允许 每 一 个 指令 有 最 多 t 个 操作 数 。 因 为 上 是 可 以 显示 地 在 
站 令 中 分 配 的 最 大 地 址 数 ， 因 此 我 们 假设 一 个 指令 的 结果 最 多 可 以 改变 存储 中 的 t 个 字 。 最 后 的 约束 
(如 果 可 以 叫做 一 个 约束 的 话 ) 是 指令 集 必须 是 有 限 的 。 

总 结 这 些 情况 ， 我 们 能 够 考虑 到 一 个 体系 结构 和 指令 集 满足 以 下 条 件 的 计算 机 的 时 间 复 杂 性 : 





组 成 条 件 

存储 : 有 限 的 

FRM: 固定 字 长 ， 每 个 字 包含 mw 个 位 

指令 集 : 有 限 的 ] 

指令 : 操作 码 和 在 一 个 字 内 的 最 多 + 个 操作 数 

操作 : 最 多 改变 上 个 字 ， 最 多 分 配 存 储 中 的 m, AF 


我 们 应 该 很 清楚 ， 大 多 数 〈 如 果 不 是 全 部 的 话 ) 标准 的 计算 机 体系 结构 和 指令 集 都 满足 这 些 根本 的 约 
束 。 至 于 某 种 具体 的 计算 机 体系 结构 的 内 存 访问 、 指 令 执行 和 程序 流 维护 的 细节 则 不 是 我 们 关心 的 问 
题 。 我 们 只 关心 执行 了 多 少 指令 。 

现在 ， 我 们 设计 一 个 图 灵机 来 模拟 包括 一 系列 指令 的 计算 机 。 我 们 使 用 图 14-1 中 给 出 的 4+1 带 
图 灵机 模型 ，t 是 指令 中 操作 数 的 数量 。 程 序 和 输入 存储 在 带 1。 像 计算 机 存储 一 样 ， 我 们 把 带 1 划分 
HZ: 带 的 位 置 0 到 位 置 m, -1 ARO, m, 到 2m,, -1 组 成 字 1， 依 此 类 推 。 我 们 使 用 简单 的 内 存 
分 配 机 制 : 顺序 地 分 配 内 存 ， 并 且 内 存 一 旦 分 配 永 远 不 会 被 释放 。 内 存 计 数 器 记录 带 1 存储 种 下 一 个 
空闲 字 的 地 址 。 

程序 计数 器 包含 下 一 个 将 要 执行 的 指令 的 位 置 。 除 非 一 个 指令 声明 使 用 下 一 个 指令 的 位 置 作 为 他 
的 一 个 操作 数 的 值 ， 程 序 控制 是 顺序 的 。 输 入 计数 器 包含 两 个 地 址 ， 即 输入 开始 的 位 置 和 要 读 的 下 一 
个 字 的 位 置 。 另 外 一 个 计数 带 用 于 在 带 1 上 定位 地 址 。 最 后 ， 共 有 1 各 工作 带 ， 一 个 与 指令 的 每 个 操 
作 数 相关 的 带 。 这 些 带 可 以 被 看 作 是 与 图 灵机 等 价 的 寄存 器 ; 只 有 相关 的 数据 被 转移 到 这 些 带 上 是 数 
据 上 的 操作 才 会 执行 。 图 14-1 显示 了 我 们 的 图 灵机 的 配置 。 

现在 ， 我 们 要 推导 图 灵机 在 模拟 一 个 计算 的 第 大 个 指令 的 M tan rat NL S 
执行 时 所 需要 的 转换 次 数 的 上 界 。 一 个 指令 可 以 取 数据 、 存 数 
据 、 分 配 存储 和 执行 计算 。 我 们 的 图 灵机 对 指令 执行 的 模拟 包 : TIT. 
uai edis TARNE diisi 

i) 针对 操作 要 求 的 每 一 个 操作 数 ， 装 载 其 相关 带 上 操作 

IO ce 
ii) 执行 给 定 的 指令 ; 
iii) 针对 操作 要 求 的 每 一 个 操作 数 ， 在 操作 数 i 指明 的 位 [I | [| [| | | [| sex 


置 存储 结果 。 
在 第 一 步 中 ， 需 要 处 理 的 数据 可 能 在 指令 内 ， 也 可 能 指令 LITILLLI 程序 计数 


仅仅 包含 了 需要 的 数据 的 地 址 。 LLELLLIIE sw 
为 了 得 到 模拟 一 个 指令 的 执行 所 需要 的 转换 次 数 的 上 界 ， 
我 们 不 切实 际 地 假设 每 一 个 指令 都 执行 了 最 大 数量 的 每 一 种 活 图 14-1 模拟 计算 机 
动 。 也 就 是 说 ,我 们 会 计算 每 一 个 指令 取 t 个 字 ， 执 行 一 个 操 i 
作 ， 存 储 t 个 字 ， 并 且 分 配 大 小 为 m, 个 字 的 存储 多 需要 的 转换 次 数 。 这 样 ， 我 们 需要 确定 每 一 个 这 样 
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的 活动 需要 多 少 次 转换 。 

由 于 指令 的 数量 是 有 限 的 ， 每 一 个 指令 最 多 使 用 t 个 操作 数 并 且 这 些 数据 在 寄存 器 带 上 的 位 置 是 
已 知 的 ， 所 以 我 们 可 以 计算 出 执行 任何 操作 所 需要 的 最 大 转换 次 数 。 我 们 把 这 个 数字 记 做 加 ,nx 仅仅 
取决 于 指令 集 并 且 与 输入 ， 数 据 和 一 个 计算 的 指令 数量 无 关 。 

装载 操作 数 和 存储 结果 需要 的 转换 次 数 依赖 于 图 灵机 正在 使 用 的 存储 的 大 小 。 我 们 设 存储 指令 需 
要 m, 个 位 ， 存 储 输 入 需要 m, 个 位 ， 并 且 在 图 灵机 开始 模拟 指令 天 时 总 共 分 配 的 存储 的 大 小 是 
m,» 因此 

m, -m,-m,*k-*m, 
是 图 灵机 在 模拟 第 个 转换 前 分 配 的 存储 的 最 大 数 。 

在 模拟 第 上 个 转移 的 过 程 中 ， 图 灵机 可 以 在 m, 个 转换 内 定 为 任意 的 地 址 。 为 了 找到 一个 字 的 开头 ， 
图 灵机 把 地 址 装载 到 计数 带 上 。 当 地 址 不 是 0 时 ， 程 序 带头 向 右 移动 m, 个 方 格 并 且 减 少 计数 带 的 值 。 
当 计 数 带 的 值 为 0 时 该 过 程 终止 ， 此 时 程序 带 的 带头 正在 读 我 们 需要 的 数据 的 第 一 个 位 。 拷 贝 地 址 最 多 
需要 m, 次 转换 。 因 为 该 过 程 不 会 读 最 后 一 个 字 的 位 ， 所 以 找到 地 址 最 多 需要 m, - m, 次 转换 。 

所 以 ， 模 拟 第 上 个 指令 的 执行 所 需要 的 转换 次 数 的 上 界 是 ; 











活动 找到 指令 装载 操作 数 返回 寄存 器 带头 。 执行 操作 存储 信息 返回 寄存 器 带头 
转换 m, ttm, Dtm, to tems) ts ms) 


由 于 操作 可 能 分 配额 外 的 存储 ， 因 此 存储 操作 可 能 要 访问 wm, 个 带 上 的 方 格 。 累 加 与 模型 指令 每 一 步 相 
关 的 转换 可 以 推导 出 模拟 第 个 指令 的 转移 上 界 : 
(2t * 1) m, *2tm,,, +t 
=(2t+1)(m, +m;+k | m,) *2t(m, m; +k*: m, +m,) +t, 
=(4t+1)m, + (4t*1)m, *2t* m, +t, +(4t+1)k: m, 
{i m,. m, Alt, 是 独立 于 输入 的 常量 。 如 果 当 计算 机 的 一 个 计算 的 输入 长 度 为 m, =n 需要 f(n) 个 步 
又 ， 那 么 我 们 的 图 灵机 的 模拟 需要 : 


Jin) 
Y ( (4t * 1) m, + (4t - 1)n «2t * m, +t, + (4t 1)k > m,) 


k=l 
fn) 
=f(n)((4t+1)m, + (4t 1)n*2t « m, +t) + bj (4t * 1)k * m, 
k=l 
fin) 


=f(n)((4t+1)m, + (4t4+1)n+2t+ m, +t) +(4t+1)m, 2 k. 


k=l 


因此 这 个 增长 的 速度 大 于 O(nf(n) ) 或 者 OCC n) ) 。 从 计算 机 到 图 灵机 的 转换 模拟 多 项 式 地 增加 了 时 
间 复杂 性 的 阶 。 在 实际 应 用 中 ,任何 一 个 在 计算 机 上 能 够 在 多 项 式 时 间 内 运行 的 算法 都 可 以 在 多 项 式 
时 间 内 被 模拟 成 图 灵机 。 


14.8 练习 


1. 从 表 14-3 中 选择 能 够 的 描述 一 下 函数 的 “最 好 ”的 大 0。 
a) 6n^ +500 
b) 2n’ +n log, (n) 
c) LG? «2n) Cn+5)/n | 
d) P -2" «n! 
e) 25- n sqrt(n) «5m +23 
2. 设 f 是 一 个 r 次 多 项 式 。 请 证 明 f 和 wn 有 同样 的 增长 速度 。 
3. 使 用 14. 2. 1 的 定义 或 者 限制 规则 证 明 以 下 的 关系 。 
a) n+ sgri(n) © O(n’) 
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b) log, (n)log; (n) e O(n) 
c) n &O(2") 
d) 2" eO(n) 


e) 2" eO(n!) 
f) n! ¢0(2") 
4. 3'€0 (2^) 是 否 正确 ? 请 证 明 你 的 答案 。 


5. 设 a 是 一 个 大 于 1 的 自然 数 ,，c 是 一 个 大 于 0 的 常量 。log, (nc) eO(log, (n) ) 是 否 正确 ? 请 证 明 你 的 
答案 。 
6. 设 f(n) = geo 
a) 证 明 对 于 任何 +>0 有 f(n) #g O(n )。 也 就 是 说 ，f(n) 不 是 多 项 式 边 界 的 ; 
b) WEH 2" gO(f(n))。 也 就 是 说 f(n) 不 是 指数 级 增长 的 。 
7. 设 f 和 8g 是 两 个 一 元 函数 ，f(n) e @(n') 并 且 g(n) e @(n')。 给 定 与 下 列 函数 有 相同 增长 速度 的 多 项 式 
大 @ 并 证 明 你 的 答案 。 
a) f+g 
b) fg 
eh 
d) fog 
8. 确定 以 下 图 灵机 的 时 间 复 杂 性 。 
a) 例 8.2.1 
b) 例 8.6.3 
c) 例 9.1.2 
d) 例 9.2.1 
9. 设 M 是 下 图 所 示 的 图 灵机 





a/aL 
b/b L 


a) 输入 入 、a 和 abb， 跟 踪 M 的 计算 。 

b) 描述 输入 长 度 为 n 的 字符 串 时 M 的 计算 所 需要 的 最 大 转换 次 数 。 

c) 给 出 函数 tcw。 
10. i M 是 下 图 所 示 的 图 灵机 


M: © B/B R (a) b/bL B/BR D 


a) 输入 abc, aab Fil cab, RER M 的 计算 。 


270 pu GERM 





b) 描述 输入 长 度 为 n 的 字符 串 时 M 的 计算 所 需要 的 最 大 转换 次 数 。 
c) 给 出 L(M) 的 正则 表达 式 。 
d) 给 出 函数 ICMo 

11. WL fa, b} EMR, WR u WE FRKE u 属于 工 
i) u=a'b' 且 length( u) «100, 或 者 
ii) length( u) >100 
a) 设计 一 个 能 够 接收 工 的 标准 图 灵机 M。 
b) 给 出 函数 ÍCy 0 
c) 能 够 描述 时 间 复 杂 性 函数 teu 的 最 好 的 多 项 式 增长 速度 是 多 少 ? 

12. 设 M=(Q, 荆 , 工 ,5,q ,FE) 是 一 个 接收 语言 L 的 双 带 图 灵机 。 设 N 是 根据 定理 14.4. 2 构造 的 机 器 (m= 
12) ， 请 求 出 N 的 带 字 母 表 的 大 小 和 状态 数 。 

“13. 设计 一 个 能 够 接收 语言 [ab |i>0| 且 时 间 复 杂 性 zeweO (nlog, (n)) 的 标准 图 灵机 。 提 示 : 每 次 经 

过 一 个 数据 时 ， 标 记 一 半 以 前 没有 标记 过 的 a 和 一 半 以 前 没有 标记 过 的 b。 


参考 文献 注释 


我 们 已 经 介绍 了 一 个 计算 在 时 间 方 面 的 复杂 性 。 第 17 章 将 研究 时 间 和 空间 复杂 性 的 关系 。Blum 
[1967] 介绍 了 一 种 度量 抽象 复杂 性 的 公理 化 方法 ，Hartmanis 和 Hoperoft [1971] 进一步 发 展 和 完善 
了 该 方法 。 在 1985 年 的 美国 计算 机 协会 (ACM) 图 灵 奖 演讲 文章 中 ，Richard Karp [1986] 描绘 了 关 
于 复杂 性 理论 的 最 初 发 展 和 方向 的 有 趣 的 个 人 历史 。 
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复杂 性 理论 是 用 于 确定 判定 问题 在 理论 上 是 不 是 可 解 的 。 在 复杂 性 理论 中 ， 我们 进一步 把 可 解 问 
题 划 分 为 有 实际 解 的 问题 和 只 是 在 理论 上 可 解 的 问题 。 问 题 在 于 ， 理 论 上 可 解 的 问题 可 能 没有 实际 
解 ; 可 能 没有 算法 可 以 在 不 需要 额外 时 间或 存储 的 情况 下 就 能 解决 问题 。 不 存在 有 效 算 法 的 问题 称 为 
难 解 的 。 由 于 时 间 复 杂 性 增长 的 速度 ， 非 多 项 式 的 算法 不 能 被 看 作 是 对 问题 的 所 有 情况 都 可 行 的 ， 而 
是 仅 对 于 问题 的 最 简单 情况 是 可 行 的 。 将 可 解 的 判定 问题 类 划分 为 多 项 式 时 间 问 题 和 非 多 项 式 时 间 问 
题 ， 其 主要 目的 是 把 高 效 的 可 解 问题 与 难 解 问题 区 分 开 来 。 

有 许多 著名 的 问题 都 有 多 项 式 时 间 的 不 确定 型 解 ， 但 是 它们 没有 多 项 式 时 间 的 确定 型 解 。 本 章 我 
们 将 揭示 使 用 确定 型 多 项 式 时 间 算 法 的 可 解 性 与 使 用 非 确 定型 多 项 式 时 间 算 法 的 可 解 性 之 间 的 关系 。 
是 否 每 一 个 使 用 不 确定 型 算法 在 多 项 式 时 间 内 可 解 的 问题 在 使 用 确定 型 算法 时 在 多 项 式 时 间 内 也 是 可 
解 的 ， 目 前 仍然 是 理论 计算 机 科学 不 能 回答 的 一 个 著名 的 开放 性 问题 。 

可 解 的 判定 问题 和 递归 语言 之 间 的 二 元 性 使 得 我 们 能 够 以 递归 语言 的 方式 定义 复杂 性 类 。: 因 为 时 
间 复 杂 性 将 输入 字符 串 的 长 度 与 转换 的 次 数 关 联 起 来 ， 因 此 判定 问题 实例 表示 的 选择 可 能 会 改变 算法 
的 复杂 性 。 为 了 将 这 种 表示 的 影响 与 问题 固有 的 难度 区 分 开 ， 我 们 将 在 表示 中 引入 一 些 简单 的 约束 ， 
这 样 ， 表 示 的 改变 只 能 在 多 项 式 时 间 内 影响 解 的 复杂 性 。 


15.1， 非 确定 型 图 灵机 的 时 间 复 杂 性 


非 确定 型 计算 与 其 对 应 的 确定 型 计算 有 本 质 的 不 同 。 确 定型 机 器 在 搜索 解 的 过 程 中 会 生成 和 检 
查 多 种 可 能 性 ; 而 非 定型 机 器 则 使 用 猜想 和 检查 策略 ， 因 而 只 需要 确定 是 否 一 个 可 能 性 能 够 提供 
解 。 考 虑 判定 一 个 自然 数 是 否 是 合 数 ( 非 素 数 ) 的 问题 。 一 个 构造 性 确定 型 解 可 以 通过 顺序 地 检 
查 每 一 个 从 2 到 Yk 之 间 的 数字 是 否 是 的 因子 来 获取 。 如 果 发 现 一 个 因子 ,那么 就 是 合 数 。 一 
个 不 确定 型 的 计算 开始 于 从 指派 的 范围 内 任意 选择 一 个 值 。 如 果 猜 想 是 一 个 因子 那么 一 个 除法 运算 
就 可 以 确定 。 如 果 大 是 合 数 ， 那 么 其 中 的 一 个 不 确定 选择 会 产生 一 个 因子 并 且 计 算 会 返回 肯定 的 
回答 。 

如 果 至 少 有 一 个 计算 能 够 终止 在 接收 状态 ， 那 么 这 个 字符 串 就 被 一 个 非 确定 型 机 器 接收 。 字 符 串 
的 接收 性 不 会 被 其 他 在 不 接收 状态 停机 或 不 停机 的 计算 的 存在 所 影响 。 然 而 ， 一 个 算法 最 坏 情况 下 的 
性 能 度量 了 整个 计算 的 效率 。 

定义 15:1.1 设 M 是 一 个 非 确 定型 图 灵机 。M 的 时 间 复 杂 性 函数 是 tcv :NN， 它 使 得 当 输 入 字 
符 串 长 度 为 n 时 ， 通过 任意 转换 的 选择 ， 一 个 计算 处 理 的 转换 的 最 大 次 数 是 teuln) o 

上 述 定义 与 确定 型 机 器 的 时 间 复 杂 度 的 定义 是 相同 的 。 该 定义 强调 了 不 确定 性 分 析 必 须 考虑 对 一 
个 输入 字符 串 的 所 有 可 能 的 计算 。 与 确定 型 机 器 的 情况 相同 ， 我们 的 时 间 复 杂 度 定义 假设 M 的 每 一 
个 计算 都 能 终止 。 

使 用 猜测 和 检查 策略 的 非 确定 型 计算 通常 比 与 其 对 应 的 确定 型 计算 简单 。 这 种 简化 减少 了 一 次 单 
独 计算 所 需要 的 转换 的 次 数 。 使 用 这 个 策略 ,我们 可 以 构造 一 个 能 够 接收 {1a,b} 上 的 回 文 的 非 确 定型 
机 器 。 

例 15.1.1 双 带 非 确定 型 图 灵机 M 能 够 接收 |a,b} 上 的 回 文 。 当 输入 被 拷贝 到 带 2 上 时 ， 两 个 带 
的 带头 都 向 右 移动 。 始 于 q, 的 转换 “猜想 ”字符 串 的 中 心 。 将 带 1 的 带头 右 移 并 将 带 2 的 带头 左 移 


的 始 于 a, 的 转换 是 对 奇数 长 度 回 文 的 检查 ， 在 同样 的 位 置 离开 带 1 的 带头 的 转换 是 对 偶数 长 度 回 文 的 、 


检查 。 如 果 带 1 和 带 2 同时 读 到 空白 接收 计算 就 停机 ， 此 时 转换 次 数 最 大 。 时 间 复 杂 性 
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n+2 Wn ATK 


team) 2D 如 果 n 是 侦 数 


说 明 偶数 长 度 字符 串 的 接收 需要 额外 的 转换 。 m 
[a/a R,B/a R] [a/a R,a/a L] 
[b/b R,B/b R] [b/b R, b/b L] 











[a/a R,B/B L) 
[b/b R,B/B L] 






o 


© [B/B R,B/B R] 





[a/a S,B/B L] 
[b/b S,B/B L] 
[B/B S,B/B L] 


第 8.7 节 介 绍 的 从 非 确定 型 机 器 到 确定 型 机 器 的 转换 所 用 到 的 策略 不 能 够 保持 多 项 式 时 间 可 解 
性 。 然 而 ， 它 却 提供 了 能 够 接收 原 非 确定 型 机 器 语言 的 确定 型 机 器 的 时 间 复 杂 性 的 上 界 。 

定理 15.1.2 设 工 是 一 个 能 被 单 带 非 确定 型 图 灵机 M vw i] MAM teu (n) =jm) 接 收 的 语言 。 
那么 工 可 以 被 一 个 确定 型 图 灵机 M' 以 时 间 复 杂 性 tcw,(n)eO(f(n)e"”) 接 收 ， 其 中 c 是 状态 和 M 中 
符号 对 转换 的 最 大 次 数 。 

证 明 ; 设 M=(Q,2,T,5,4o) 是 一 个 能 够 对 所 有 输入 停机 的 单 带 非 确定 型 图 灵机 ， 设 5 是 状态 和 
M 中 符号 对 转换 的 最 大 次 数 。 我 们 通过 将 M 的 一 个 惟一 的 计算 与 一 个 序列 (m,,…,m,) (其 中 1<m, 
Sc) 关联 起 来 从 而 实现 从 非 确 定性 到 确定 性 的 转换 。m; 的 值 表示 M 的 c 个 可 能 的 转换 中 ， 哪 个 转换 
应 该 在 计算 的 第 i 步 执 行 。 

在 第 8.7 节 我 们 介绍 了 一 个 三 带 确定 型 图 灵机 M'， 当 输入 为 时 ， 它 的 计算 能 够 闪 代 地 模拟 M 
输入 为 w 时 的 所 有 可 能 计算 。 对 于 每 一 个 长 度 为 元 的 输入 ，M 的 任意 一 个 计算 的 最 大 转换 次 数 为 
f(n)。 为 了 模拟 M 的 一 个 单独 的 计算 ， 机 器 M' 

1. 生成 一 个 整数 序列 (mm ,…, m,)， 其 中 1<m,<c; 

2. 模拟 序列 (mi ,…,m, ) 描 述 的 M 的 计算 ;并且 

3. 如果 计 算 不 接收 这 个 字符 串 ， 那 么 M' 回 到 步骤 1 继续 执行 。 

在 最 坏 的 情况 下 需要 检查 oA” 个 序列 。M' 可 以 使 用 O(f(n)) 个 转换 来 模拟 M 的 一 Re 
因此 ，M’ 的 时 间 复 杂 性 是 OCf( n) cc), 

定理 15. 1. 2 介绍 的 时 间 复 杂 性 OCf( n) c" ) 是 从 M' 到 M 的 特殊 构造 的 制品 。 Sa 
特定 语言 的 属性 的 方法 也 可 以 用 于 设计 确定 型 图 灵机 ， 并 且 其 时 间 复 杂 性 比 定理 15. 1.2 给 出 的 上 界 
小 很 多 。 例 如 ， 当 处 理 一 个 长 度 为 n 的 输入 字符 串 时 ,例题 8. 7 中 能 够 接收 (aUbUc) * (abcUcab)(a 
UbUc)“ 的 非 确定 型 机 器 最 多 使 用 n +3 个 转换 。 定 理 15. 1.2 使 用 的 构造 方法 生成 一 个 能 够 以 时 间 复 
杂 度 O(n - 3" ) 接 收 语言 的 确定 型 机 器 。 然 而 ， 这 个 语言 同样 也 可 以 被 标准 图 灵机 以 时 间 复 杂 度 n+1 
接受 。 

后 面 几 节 的 内 容 将 分 析 介绍 能 够 在 多 项 式 时 间 内 被 确定 地 解 出 的 问题 和 能 够 在 多 项 式 时 间 内 被 非 
确定 地 解 出 的 问题 之 间 的 关系 。 


15.2 ”了 ?类 和 入? 类 


设 工 是 之 上 的 一 个 语言 ， 如 果 存 在 一 个 能 够 确定 工 的 成 员 资 格 的 算法 ， 计 算 所 要 求 的 时 间 至 多 会 
随 着 输入 串 长 度 增长 而 多 项 式 地 增长 ， 那 么 说 工 在 多 项 式 时 间 内 是 可 判定 的 或 者 简称 为 多 项 式 的 。 多 
项 式 时 间 可 判定 性 的 概念 是 通过 标准 图 灵机 的 转换 定义 的 ， 它 能 够 用 于 度量 计算 的 时 间 。 

定义 15.2.1 一 个 语言 L 是 多 项 式 时 间 是 可 判定 的 ， 如 果 存 在 一 个 能 够 以 tcw e O(n') 接 收工 的 
标准 图 灵机 M， 其 中 +r 是 一 个 与 nn 无 关 的 自然 数 。 多 项 式 时 间 可 判定 的 语言 的 家 族 表示 为 下。 
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中 类 以 在 标准 图 灵机 上 的 算法 应 用 的 时 间 复 杂 性 的 形式 来 定义 。 我 们 可 以 像 选择 算法 度量 的 计算 
模型 那样 ， 简 单 地 选择 一 个 多 道 ， 多 带 或 者 双向 确定 型 图 灵机 。 在 为 分 析 而 选 定 的 确定 型 图 灵机 模型 
的 选择 下 ， 多 项 式 可 判定 语言 或 可 解 的 判定 问题 的 了 类 是 不 变 的 。 第 14. 4 节 介绍 了 可 以 被 一 个 多 道 
机 器 在 时 间 O(n ) 接 收 的 语言 也 可 以 被 一 个 标准 图 灵机 在 时 间 O(n ) 接 收 。 从 多 带 图 灵机 到 标准 图 灵 
机 的 转换 保持 了 多 项 式 解 。 一 个 可 以 被 多 带 机 器 在 O(n') 接 收 的 语言 可 以 被 标准 机 器 在 时 间 O(n”) A 
接收 。 

第 14.7 节 分 析 了 在 计算 机 上 运行 程序 的 复杂 性 和 在 图 灵机 上 对 其 进行 模拟 的 复杂 性 之 间 的 关系 。 
与 计算 机 执行 的 指令 数 相 比 ， 图 灵机 模拟 的 转换 次 数 仅 有 多 项 式 的 增加 。 因 此 任何 一 个 我 们 认为 在 标 
准 计 算 机 上 多 项 式 可 解 的 问题 均 是 在 了 中 的 。 处 于 机 器 和 体系 结构 变化 中 的 了 类 的 和 鲁 棒 性 为 选择 其 定 
义 可 解 问题 和 难 解 问题 的 边界 提供 了 支持 。 

解决 判定 性 问题 的 非 确定 型 机 器 的 计算 检查 问题 的 一 个 可 能 解 。 非 确定 地 选择 一 个 潜在 的 解 而 不 
是 系统 的 解决 所 有 可 能 的 解 的 能 力 降低 了 非 确定 型 机 器 的 计算 的 复杂 度 。 与 定义 于 类 的 方法 相同 ， 我 
们 可 以 定义 在 多 项 式 时 间 内 被 非 确定 型 图 灵机 接收 的 语言 的 家 族 。 

定义 15.2.2 一 个 语言 L 被 称 为 能 够 在 非 确定 的 多 项 式 时 间 (nondeterministic polynomial time ) 
内 被 接收 ， 如 果 存 在 一 个 能 以 te, e O(n ) 接 收工 的 非 确定 型 图 灵机 M， 其 中 + 是 一 个 与 nn 无关 的 自然 
数 。 可 以 在 非 确 定 的 多 项 式 时 间 内 被 接收 的 语言 的 家 族 表示 为 Ny9 。 

N 了 家 族 是 递归 语言 的 一 个 子 集 ; 转换 次 数 的 多 项 式 边 界 保证 类 M 的 所 有 计算 最 终 都 能 终止 。 因 
为 每 一 个 确定 型 机 器 也 是 一 个 不 确定 性 机 器 ， 所 以 ?ES NP 。 相 反 结 论 的 状态 是 本 章 后 续 内 容 的 
话题 。 


15.3 问题 表示 和 复杂 性 

用 于 解决 判定 问题 的 图 灵机 的 设计 包括 两 个 步骤: 首先 是 问题 实例 的 字符 串 表 示 ， 其 次 是 设计 分 
析 结 果 字 符 串 和 解决 问题 的 机 器 。 在 判定 性 的 学 习 中 ,我 们 惟一 关心 的 是 有 没有 考虑 到 解决 问题 的 算 
法 的 发 现 以 及 计算 需要 的 资源 。 因 为 图 灵机 的 时 间 复 杂 性 把 输入 的 长 度 和 计算 中 转换 的 次 数 关联 起 来 
了 ， 所 以 表示 法 的 选择 可 以 对 计算 需要 的 工作 量 有 重要 影响 。 

在 第 11 章 中 ， 我 们 设计 了 两 个 简单 的 用 于 解决 一 个 自然 数 是 否 是 偶数 的 判定 问题 的 图 灵机 。 机 
器 M, 的 输入 使 用 自然 数 的 一 元 表示 法 ， 机 器 M, 的 输入 使 用 二 进 制 表示 法 : 


IIR 
M: X45) — 5 (8) — — (2) 


1/1 R 


0/0 R 
1/1 R 


Mj © B/B R R B/B L © 0/0 R 


这 两 个 机 器 的 时 间 复 杂 性 是 线性 的 ， 并 且 表 示 法 的 不 同 没有 显著 地 影响 复杂 性 。 不 幸 地 是 ， 情 况 并 不 
总 是 这 样 。 机 器 M 的 改动 会 给 复杂 性 带 来 明显 的 影响 。 

我 们 可 以 构造 一 个 图 灵机 工 来 将 用 二 进 制 表示 的 自然 数 转 换 为 一 元 法 表示 的 自然 数 〈 练 习 6) T 
和 M, 的 顺序 操作 生成 Ma o 


M, 是 偶数 问题 的 另外 一 个 解决 方案 。 让 我 们 来 看 一 下 这 个 方案 的 复杂 性 。 下 面 的 表 给 出 了 二 进 
制 表 示 到 一 元 表示 的 转换 导致 的 字符 串 长 度 的 增加 。 第 二 列 给 出 了 第 一 列 中 字符 串 长 度 的 最 大 二 进 制 
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数 ， 最 后 一 列 是 相应 的 一 元 表示 。 


FH BIKE fc — HA 十 进 制 值 一 元 表示 
1 1 1 11 =1° 





9 11 3 1111 =14 
3 111 7 111111111 z 1? 
i 1: 2 -1 L5 





M, 的 时 间 复 杂 性 是 由 T 和 M, 的 复杂 性 决定 的 。 对 于 每 个 长 度 为 i WWA, FAE 1 要求 M; 最 大 次 
数 的 转换 。M 的 时 间 复 杂 性 是 : 
Icy, (n) =tcr(n) tes (2^) 
=tc,(n) +2(2") +2, 
及 时 转换 没有 添加 额外 的 工作 ， 这 个 复杂 性 也 是 指数 级 的 。M, 回答 这 个 问题 的 策略 没有 改变 ; 之 所 
以 会 有 时 间 复 杂 性 的 增加 是 因为 使 用 二 进 制 表 示 减 小 了 输入 字符 串 的 长 度 。 

下 面 假设 的 情况 进一步 说 明了 在 评估 判定 问题 的 时 间 复 杂 性 时 表示 法 的 重要 性 。 假 设 一 个 问题 P， 
它 的 实例 使 用 字母 表 王 上 的 字符 串 表 示 ， 该 问题 可 以 被 图 灵机 M. 以 时 间 复 杂 性 tc (n) 22^ 解决 。 我 
们 可 以 按照 下 述 方法 为 P 构造 男 外 一 个 表示 法 : 在 字母 表 中 添加 一 个 新 的 字符 #， 如 果 一 个 问题 实例 
在 原 表 示 法 中 被 表示 为 长 度 为 n 的 字符 串 w， 那么 在 新 的 表示 法 中 它 被 表示 为 wE "o der AT DURAS 
M 得 到 一 个 解决 问题 P 的 机 器 M'。 除 了 M' 处 理 # 的 方式 与 M 处 理 空白 的 方式 一 样 以 外 ，M' 的 计算 与 
M 的 计算 也 相同 。 由 于 输入 字符 串 长 度 的 增加 ， 所 以 te (n) =n, 

上 述 例子 提供 了 一 种 操作 时 间 复 杂 性 函数 的 方法 ， 以 便 人 工地 将 低 效 的 算法 改 为 高 效 的 算法 。 如 
果 可 以 改变 输入 字符 串 的 长 度 而 不 改变 下 面 的 计算 ， 那 么 在 时 间 复 杂 性 函数 上 就 存在 二 个 相应 的 
缩减 。 

时 间 复 杂 性 对 表示 的 大 小 的 依赖 说 明 对 复杂 性 分 析 而 言 ， 不 是 每 一 个 表示 法 都 是 可 接收 的 。 使 用 
最 小 的 表示 可 以 避免 表示 长 度 对 复杂 性 的 影响 。 然 而 ， 这 样 一 个 需求 过 于 严格 也 没有 必要 。 我 们 介绍 
多 项 式 时 间 转 换 的 概念 是 为 了 非 形式 化 地 描述 表示 法 对 复杂 性 分 析 的 适宜 性 条 件 。 

有 实例 po ,pi ,p,,… 的 判定 问题 P 的 表示 法 是 一 个 从 间 题 实例 到 王 上 的 字符 串 的 映射 rep, Hp 
rep(pi) 是 pi; 的 表示 法 。 设 rep, 和 rep, 分 别 是 P 在 字母 表 且 , WEBER YE. 上 的 表示 法 。 表 示 法 rep, 是 
多 项 式 时 间 可 转换 为 rep, 的 ， 如 果 存 在 一 个 函数 1 Xr; 使 得 : 

i) 对 于 所 有 的 i 都 有 i(repi(p;)) =rep; (pi); 

i) 如 果 wue > 7 不 是 问题 实例 的 表示 法 ， 那么 + (u) HALLS 中 问题 实例 的 表示 法 ; A 

ii) 上 是 标准 图 灵机 T 在 多 项 式 时 间 内 可 计算 的 。 

如 果 rep, 在 多 项 式 时 间 可 转换 为 rep, ， 那 么 相对 于 rep, (p) WIEBE, t( rep, Cp,) ) 的 长 度 不 可 能 以 
快 于 多 项 式 的 方式 增长 ; 可 以 添加 到 表示 法 中 的 字符 的 数目 必然 少 于 T 的 转换 次 数 。 

现在 ， 假 设 P 是 图 灵机 M 使 用 表示 法 rep, 在 多 项 式 时 间 内 可 解 的 。T 和 了 的 顺序 组 合 


是 
Lid pas 一 | vw pm 


能 够 产生 一 个 使 用 表示 法 rep, 的 多 项 式 时 间 解 。 因 此 ， 仅 仅 有 多 项 式 差 别 的 表示 法 之 间 的 不 同 不 会 影 
响 到 问题 的 可 解 性 。 一 个 问题 的 最 合理 的 表示 法 仅 在 长 度 上 与 最 小 表示 法 有 多 项 式 的 差别 。 这 种 情况 
的 一 个 明显 的 例外 是 使 用 一 元 表示 法 的 自然 数 ， 与 二 元 表示 法 的 输入 字符 串 长 度 相 比 ， 此 时 输入 字符 
串 长 度 成 指数 级 增加 。 正 是 这 个 原因 ， 自 然 数 复杂 性 分 析 永 远 是 用 二 进 制 表示 法 。 根 据 这 一 点 ， 我 们 
使 用 符号 i 表示 数字 i 的 二 进 制 形式 。 

根据 以 上 描述 的 方针 ， 一 个 使 用 一 元 表示 法 表示 自然 数 有 多 项 式 解 但 是 使 用 二 进 制 表示 法 表示 自 
然 数 没有 多 项 式 解 的 问题 不 被 认为 是 多 项 式 时 间 可 解 的 。 这 个 属性 的 问题 被 叫做 伪 多 项 式 的 〈pseudo- 
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polynomial) ， 因 为 对 那些 没有 意识 到 表示 法 影响 的 人 而 言 ， 在 分 析 判 定 问题 的 复杂 性 时 ， 使 用 一 元 表 = [471] 
示 法 的 解 看 上 去 是 多 项 式 时 间 解 。 


15.4 判定 问题 和 复杂 性 类 


本 节 我 们 列 出 了 几 个 了 类 和 N9? 类 中 的 判定 问题 。 我 们 不 会 描述 解决 这 些 问题 的 算法 细节 ， 因 为 

前 面 的 内 容 已 经 给 出 了 它们 的 解 或 者 后 续 几 章 将 会 详细 介绍 他 们 的 解法 。 这 个 列表 的 目的 是 从 每 个 类 
中 提供 一 些 熟悉 的 问题 的 例子 ， 以 便 识 别 出 同 一 个 类 中 解决 问题 的 算法 共有 的 属性 。 

回 文 的 接收 性 问题 

输入 : 字母 表 忆 上 的 字符 串 式 

输出 : 是 ; 如 果 是 一 个 回 文 

F; 其 他 

复杂 性 : 在 了 内 一 一 是 


有 向 图 的 路 径 问 题 

输入 : 图 G=(N,A), 节点 v, v,eN 

输出 : 是 ; 如果 在 G 中 从 v 到 vw 存在 一 条 路 径 
T; 其 他 

复杂 性 : 在 人 了 内 一 是 


乔 姆 斯 基 范 式 语 法 中 的 可 导 性 

输入 : 乔 姆 斯 基 范 式 语 法 ， 字 符 串 w 

输出 : 是 ; 如 果 存 在 一 个 推导 5 沪 W 

T; 否则 

复杂 性 : 在 了 内 一 一 是 

上 述 的 每 一 个 问题 都 有 和 多项式 时 间 解 。 正 如 第 14.3 节 介 绍 的 ， 回 文 可 以 被 标准 图 灵机 以 时 间 复 

杂 性 O(n’) HES, HATE (Dijkstra) 的 算法 可 在 O(rw) 时 间 内 发 现 两 个 节点 之 间 的 路 径 (如 果 
存在 这 样 的 路 径 ) ， 其 中 是 图 中 节点 的 个 数 。 第 4.6 节 介 绍 的 CYK 算法 可 用 O( 产 ) 个 步骤 完成 动态 
编程 表 ， 从 而 确定 由 乔 姆 斯 基 范 式 语 法 定义 的 语言 的 成 员 资格 。 

可 满足 性 

输入 : 合 取 范式 形式 的 布尔 公式 u 

输出 : 是 ; 如 果 一 个 为 真 的 赋值 满足 u 


否 ; 否则 
复杂 性 : 在 了 内 一 一 未 知 

TEN? 内 一 一 是 472 
哈密 尔 顿 回路 问题 


A: 有 向 图 G=(N,A) 
输出 : 是 ;如 果 存 在 一 个 能 够 正好 访问 G 的 所 有 边 一 次 的 简单 回路 


否 ; 否则 
复杂 性 : 在 了 内 一 一 未 知 
TEN? 内 一 是 
和 的 子 集 问题 


输入 : EFS, 函数 v: SN, 数字 天 
输出 : 是 ; 如 果 存 在 一 个 $ 的 子 集 S ， 且 S 的 总 和 是 天 
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f; 否则 
复杂 性 : 在 了 内 一 一 未 知 
在 NP 内 一 荐 


我 们 使 用 猜想 和 检查 策略 可 以 较 容易 地 以 非 确定 方式 解决 上 述 的 每 一 个 问题 。 可 满足 性 问题 的 狂 
想 是 一 个 独立 的 真 值 赋值 。 根 据 公式 的 长 度 ， 可 以 在 多 项 式 时 间 内 验证 一 个 特定 的 真 值 赋值 是 否 满足 
合 取 范式 形式 的 公式 。 哈 密 尔 顿 (Hamiltonian) 回路 问题 的 猜想 是 构成 一 个 包含 n+1 个 节点 的 序列 ， 
验证 过 程 检查 这 个 序列 是 否定 义 了 图 的 一 次 周游 。 相 似 的 ， 和 的 子 集 问题 的 猜想 是 一 个 子 集 ， 检 查 仅 
仅 是 累加 子 集中 的 值 。 

对 那些 对 了 而 言 是 未 知 的 问题 来 说 ， 确 定型 算法 通常 不 能 提供 对 问题 本 质 的 洞察 力 ， 而 只 是 执行 
一 个 穷 举 搜索 。 下 一 节 我 们 会 给 出 这 个 问题 的 说 明 ， 同 时 我 们 介绍 哈密 尔 顿 回路 问题 的 确定 型 解法 和 
非 确定 型 解法 。 

我 们 再 给 出 一 个 前 面 介 绍 过 的 问题 ， 它 不 属于 复杂 性 类 。 这 个 问题 考虑 的 是 确定 由 正则 表达 式 描 
述 的 、 可 以 包含 用 ww 当 作 uu 的 缩写 的 语言 。 例 如 ，( 必 ) "p(aU2) “表示 所 有 这 样 的 字符 串 ， 这 些 字 
FRH, EHA b 出现 之 前 有 偶数 个 a 

带 平方 的 正则 表达 式 
输入 : 字母 表 区 上 的 正则 表达 式 a 
输出 : 是 ; uRaeXE 


否 ; 否则 
复杂 性 : 在 内 一 一 否 
在 N 了 内 一 一 否 


在 介绍 了 空间 复杂 性 后 ， 我 们 还 会 介绍 这 个 问题 的 任何 一 个 解法 所 需要 的 空间 和 时 间 都 与 正则 表 
达 式 的 长 度 成 指数 级 的 增长 。 


15.5 哈密 尔 顿 回路 问题 


我 们 在 这 里 介绍 哈密 尔 顿 回路 问题 是 为 了 说 明 判定 问题 的 确定 型 解 和 不 确定 型 解 在 策略 和 复杂 人 性 
两 方面 的 差异 。 首 先 我 们 对 前 面 介绍 的 问题 给 出 一 个 更 详细 的 描述 。 

Bt G 是 亚 个 节点 的 有 向 图 ， 其 节点 编号 从 Bln, 哈密 尔 顿 回路 是 G 中 满足 以 下 条 件 的 路 径 i, 
ETE 

i) ly =i, 

ii) 4iAjM, Li, (0<i,j<n) 
也 就 是 说 ， 哈 密 尔 顿 回路 是 一 条 访问 每 个 节点 一 次 且 仅 一 次 、 终 止 于 起 始点 的 路 径 。 一 个 哈密 尔 顿 回 
路 通常 叫做 一 个 周游 (Tour), 。 例 如 ， 图 G, 的 一 个 周游 是 v, VV nn, G, 没有 周游 。 


Gi WE AD G: © (v) 
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哈密 尔 顿 回路 问题 是 要 判定 一 个 有 向 图 是 否 有 一 个 周游 。 因 为 每 一 个 节点 都 包含 在 周游 内 ， 所 以 我 们 
假设 每 一 个 周游 都 开始 并 结束 于 节点 1。 d 

例 15. 5. 1 的 确定 型 解 完全 彻底 地 搜索 节点 序列 以 判定 每 一 个 序列 是 否 是 周游 。 该 方法 系统 地 生 
成 和 测试 了 节点 序列 直到 发 现 一 个 周游 或 者 所 有 的 可 能 都 检查 完毕 为 止 : 删除 上 述 的 生成 和 测试 循环 
可 以 得 到 非 确定 型 解 。 一 个 非 确定 型 猜测 生成 一 个 节点 序列 ， 并 使 用 与 确定 型 计算 相同 的 过 程 检查 其 
子 序列 。 
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例 1S.5.1 在 本 例题 中 ， 我 们 介绍 一 个 解决 哈密 尔 顿 回路 问题 的 四 带 确定 型 图 灵机 的 活动 。 第 一 
步 是 为 节点 编号 从 1 到 nn 的 有 向 图 设计 表示 法 。 表 示 法 的 字母 表 是 10,1,#| ， 并 且 使 用 节点 编号 的 二 
进 制 形式 表示 节点 。 一 个 有 nn 个 节点 m 条 边 的 图 可 以 表示 为 以 下 的 输入 字符 串 

X, Hy, THE - HE, Hy, Hin, 
其 中 [x;,y;] 是 图 的 边 , x 是 数字 x 的 二 进 制 形 式 。 

在 整个 计算 中 , 带 1 用 于 维护 边 的 表示 。 该 计算 能 够 生成 和 检查 n+1 个 节点 的 序列 1,ii,…,i,_，， 
1 以 便 确 定 它们 是 否 组 成 一 个 周游 。 计 算 在 带 2 上 按照 顺序 生成 序列 。 序 列 ]，n，…n，1 的 表示 记录 
在 带 4 上 并 且 用 于 触发 停机 条 件 。 图 8 -1 中 图 灵机 使 用 的 技术 可 用 于 在 带 2 上 生成 序列 。 

一 个 计算 是 满足 下 列 条 件 的 循环 : 

l. 在 带 2 上 生成 一 个 序列 BIB i, Bi,B---Bi,_,B1B, 

2. 如 果 带 2 和 带 4 相同 则 停机 ， 并 且 

3. 检查 序列 1,4 ,…,i,_1 ,1 ,如果 该 序列 是 一 个 周游 则 停机 。 

如 果 计 算 在 第 二 步 停机 ,那么 所 有 检查 过 的 序列 以 及 这 个 图 都 不 包含 哈密 尔 顿 回 路 。 

第 三 步 的 分 析 开 始 于 机 器 配置 

带 4 = BI(Bn)""'BIB 

带 3 BIB 

带 2 BIlBiB-Bi,,BlB 

带 1 Bx, Hy H Ax, Hy, BIHHInB , 

我 们 依次 被 检查 节点 i, ,… ,i,_1。 满 足下 列 条 件 时 ， 节 点 i 将 被 添加 到 带 3 的 序列 中 : 

i) i1; 

ii) ijzi (1<k<j-1); 并 且 

i) ap) P9 DEus ble 
也 就 是 说 ， 如 果 1 ,i ,… ,i 是 图 中 的 一 个 非 循环 路 径 ， 那么 i 被 加 入 进来 。 如 果 带 2 上 序列 的 每 一 个 
节点 (j=i,...n 一 1) 都 被 添加 到 带 3 并 且 存 在 一 条 从 i,_, 到 1 8932, 那么 带 2 上 的 路 径 就 是 一 个 周游 
并 且 计算 接收 该 输入 。 

当 输 入 图 不 包含 一 个 周游 时 ， 该 计算 会 检查 和 拒绝 每 一 个 1 ,i ,…,i,., ,1 序列 。 对 于 一 个 有 nn 个 
节点 的 图 ， 存 在 wn” 个 这 样 的 序列 。 除 了 检查 序列 相关 的 计算 ,序列 的 数量 随 着 图 的 节点 数 做 指数 级 
增长 。 由 于 我 们 使 用 二 进 制 形式 为 节点 编码 ， 因 此 ， 如 果 节 点 的 数目 增加 到 2n (但 是 图 中 边 的 数量 不 
增加 )， 那么 输入 字符 串 的 长 度 就 增加 一 个 字符 。 所 以 ,增加 输入 的 长 度 会 导致 必须 被 检查 的 潜在 序 
列 数 量 的 指数 级 增长 。 L1 

我 们 已 经 介绍 过 哈密 尔 顿 回 路 问题 在 指数 时 间 内 是 可 解 的 。 这 个 问题 不 属于 多 项 式 时 间 内 也 不 能 
解决 的 范畴 。 到 目前 为 止 ， 还 没有 发 现 多 项 式 时 间 算 法 。 这 也 许 是 因为 不 存在 这 样 的 解 或 者 也 许 是 因 
为 我 们 不 够 聪明 所 以 没有 发 现 ! 发 现 多 项 式 时 间 解 法 的 可 能 性 和 分 支 是 本 章 后 续 内 容 的 主要 话题 。 . 

使 用 猜想 和 检查 策略 的 不 确定 性 计算 通常 比 他 们 对 应 的 确定 性 计算 简单 。 这 种 简化 减少 了 计算 所 
需要 的 转换 次 数 。 人 们 通常 构造 使 用 这 种 策略 的 不 确定 型 图 灵机 来 在 多 项 式 时 间 内 解决 哈密 尔 顿 回路 
问题 。 

例 15.5.2 我 们 可 以 通过 修改 例 15. 5. 1 中 的 确定 型 图 灵机 来 构造 一 个 在 多 项 式 时 间 内 解决 哈密 
尔 顿 回路 问题 的 三 带 非 确定 型 图 灵机 。 非 确定 型 图 灵机 不 再 需要 第 四 条 带 ， 在 确定 型 图 灵机 中 ， 当 图 
不 包含 周游 时 这 条 带 用 于 结束 计算 。 计 算 

1. 停机 并 且 拒 绝 输 入 ， 如 果 图 中 包含 少 于 n+1 RA, 

2. 在 带 2 上 非 确定 性 地 生成 序列 1,i ,…,i,_1,1,， FFA 

3. 利用 带 1 和 带 3 来 确定 带 2 上 的 序列 是 否定 义 了 一 个 周游 。 

为 了 说 明 非 确定 型 图 灵机 是 多 项 式 的 ， 我 们 为 计算 中 的 转换 次 数 构造 一 个 上 界 。 当 节点 序列 定义 
一 个 周游 时 转换 次 数 达 到 最 大 。 否 则 ,计算 终 止 时 在 带 2 上 检查 的 边 数 少 于 n+1。 由 于 节点 是 用 二 进 
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制 形式 表示 的 ， 所 以 带 需 要 对 任意 一 个 节点 编码 的 最 大 次 数 是 [log (n) | + 1。 

最 坏 情 况 下 的 性 能 在 当 图 包含 多 于 n +1 条 边 时 发 生 。 包 含 更 少 边 的 图 的 计算 在 第 工 步 停 机 ， 从 
而 避免 了 第 3 步 检查 所 需要 的 转换 。 因 此 ， 算 法 最 坏 情 况 下 性 能 的 输入 长 度 依赖 于 图 中 边 的 数量 。 设 
k 是 边 的 条 数 。 我 们 将 说 明 转 换 次 数 的 增长 速度 是 的 多 项 式 。 由 于 输入 长 度 不 能 比 k 增 长 得 更 慢 
(每 条 边 在 带 上 至 少 需要 三 个 位 置 ) ， 所 以 其 时 间 复 杂 性 是 多 项 式 的 。 

在 第 | 步 拒 绝 输入 要 求 计算 比较 输入 中 边 的 数量 和 节点 的 数量 。 这 项 工作 可 以 在 随 边 数 多 项 式 地 
增长 的 时 间 内 完成 。 

如 果 计 算 不 在 第 1 步 停机 ， 那 么 我 们 可 以 得 知 边 的 数量 大 于 节点 的 数量 。 在 带 2 上 生成 猜测 并 重 
新 布置 带头 的 位 置 需要 O(mlog (n) ) 次 转换 。 现 在 我 们 假设 带 3 包含 带 2 上 的 初始 序列 B Tii sess 
后 续 的 计算 包含 一 个 循环 : 

1. 移动 带 2 和 带 3 的 带头 至 带 3 的 第 一 个 空白 的 位 置 (O(nlog,(n) ) 次 转换 ) , 

2. 检查 带 2 上 已 经 编码 的 节点 是 否 已 经 在 带 3 上 (O(nlog;(n) ) 次 转换 ) , 

3. 检查 从 i Bl i, 是否 存在 一 条 边 (O(nlog,(n) ) 次 转换 检查 所 有 边 并 重新 布置 带头 的 位 置 ) ,并且 

4. 在 带 3 上 写 i 并 重新 布置 带头 的 位 置 (O(nlog,(n) ) 次 转换 ) 。 

一 个 计算 包括 在 带 2 上 生成 序列 ， 随 后 是 检查 序列 。 检 查 序列 的 循环 一 直 重 复 执行 直到 带 2 上 的 
每 一 个 节点 i, ,…,i,_1 都 被 检查 。 步 骤 3 的 重复 会 导致 整个 计算 中 转换 的 次 数 以 速度 (CO CK log; (X) ) 
增长 。 

非 确定 型 机 器 时 间 复 杂 度 的 增长 速度 是 由 计算 时 在 边 列表 中 搜索 某 个 特定 边 的 过 程 决定 的 。 这 与 
确定 型 机 器 不 同 ， 确 定型 机 器 对 nn 个 节点 的 整个 序列 集合 的 穷尽 搜索 决定 了 其 增长 速度 。 m 


15.6 多 项 式 时 间 归 约 


语言 工 到 语言 Q 的 归 约 把 L 的 成 员 资格 问题 转换 为 Q 的 成 员 资格 问题 。 归 约 在 语言 可 判定 性 证 
明 中 扮演 重要 角色 ， 并 且 与 分 类 问题 中 的 可 解 性 有 同样 重要 的 作用 。 设 > 是 机 器 R 计算 的 从 工 到 Q 的 
归 约 。 如 果 Q 被 机 器 M 接收 ， 那 么 L 也 会 被 下 面 这 样 的 机 器 接收 : 

i) 在 输入 字符 串 we E! bifTR, FA 

ii) Ær (w) 上 运行 M。 

"ETE r (w) 被 M 接收 ， 当 且 仅 当 weL。 在 复杂 性 分 析 中 ，L 成 员 资格 问题 复合 解 的 时 间 复 杂 性 分 
析 包 括 转换 工 的 实例 所 需要 的 时 间 和 获得 Q 的 解 所 需要 的 时 间 。 因 为 我 们 把 高 效 可 解 的 问题 和 多 项 式 
时 间 复 杂 性 看 作 是 等 价 的 ， 因 此 用 同样 的 条 件 要 求 一 个 归 约 的 时 间 复 杂 性 似乎 是 合理 的 。 

EX 15.6.1 RLPQPMAFHRAY, BTEREX, 上 的 语言 。 我 们 称 荆 对 Q 是 多 项 式 时 间 可 
归 约 (reducible in polynomial time) ， 如 果 存 在 一 个 多 项 式 时 间 的 计算 函数 r: Y; X; £ft wel 4 
且 仅 当 r(w) e Q。 

多 项 式 时 间 归 约 非常 重要 ， 因 为 归 约 的 转换 的 边界 限制 了 后 续 机 器 输入 字符 串 的 长 度 。 这 个 属性 
保证 了 多 项 式 时 间 归 约 和 多 项 式 时 间 算 法 的 结合 能 够 产生 另外 一 个 多 项 式 算 法 。 

定理 15.6.2 设 工 是 可 以 在 多 项 式 时 间 内 归 约 到 Q 的 语言 有 全 Qe 了 ,那么 Le 了。 

证 明 : 如 前 所 述 ， 我 们 设 R 表示 计算 从 LL 到 QQ 的 归 约 的 机 器 ，M 是 决定 Q 的 机 器 。L 能 被 顺序 
运行 R 和 M 的 机 器 接收 。 时 间 复 杂 性 ter 和 teu 结合 以 生成 复合 机 器 的 计算 的 转换 次 数 上 界 。 输 入 为 
wit, R 的 计算 生成 字符 串 r(w) e > ， 它 同时 也 是 M I AS PRA ter 可 以 用 于 说 明 输 入 长 度 为 
r(w) 时 的 边界 。 如 果 R 的 输入 字符 串 w BE BEDS n, WA r(w) 的 长 度 不 可 能 超过 n 和 te, (n) 的 
最 大 值 。 

M 的 计算 最 多 处 理 tcv(k) 次 转换 ， 其 中 是 其 输入 字符 串 的 长 度 。 复 合 机 器 的 转换 次 数 以 两 个 独 
立 计 算 估 计 的 和 为 边界 。 如 果 tc, e O(n) H te, eO(n'), ABA 

tca(n) * tc, (tc, (n) ) € O(n"). [c] 
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Gi 15.6.1 图 灵机 RR 


xR B/BL zBL 





x/BL 
yBL 
zBL 
将 语言 L= {xy'z liz0,k20]IH298] Q= [ab [i20] ; 11.3 节 已 经 给 介绍 了 这 个 归 约 的 动机 。 现 在 我 
们 关心 的 是 它 的 时 间 复 杂 性 分 析 。 
对 于 长 度 为 0 和 1 的 字符 串 ，tca(0) 22 H tca(1) =4。 当 一 个 z 后 有 一 个 x 或 者 y 时， 对 字符 串 
后 续 部 分 的 最 坏 情 况 下 的 计算 得 以 发 生 。 在 这 种 情况 下 ,输入 字符 串 在 状态 qq. 和 4 BA, ER 
态 qs 被 擦 除 。 机 器 可 以 通过 在 输入 位 置 写 a 来 完成 计算 。 时 间 复 杂 性 是 t4 (n) =2n+4 (n>1)。 
考虑 以 下 RAM 地 结合 


是 , 如 果 r(w)e Q 
» rv * b i M 
wE {x,y,z} zr r(w) € {a,b} 否 , 如 果 r(w) éQ 


M 可 以 以 时 间 复 杂 性 teu (n) = (n° +3n+4)/2 接收 Q。 对 字符 串 x y" ini, Rada 
机 器 的 性 能 最 差 ; 对 字符 串 x”*"?y”" “而 言 ， 如 果 nn 是 奇数 那么 复合 机 器 的 性 能 最 差 。 工 成员 资格 
问题 的 结果 方案 的 复杂 性 是 
tc, (n) tes (tc (n)) =2n +2 + (i +3n4+4)/2, 

这 个 复杂 性 在 定理 15. 6. 2 的 证 明 给 出 的 上 界 内 。 口 

问题 归 约 为 我 们 比较 两 个 问题 的 相对 难度 奠定 了 基础 。 如 果 两 个 问题 的 解 的 时 间 复 杂 性 仅 有 多 项 
式 的 差别 ， 那 么 我 们 认为 他 们 的 难度 相同 。 也 许 应 该 指出 ,与 O(n’) 算法 相 比 我 们 更 倾向 于 O(n’) 
算法 ,并 且 人 们 花费 了 相当 多 的 时 间 和 精力 来 降低 许多 算法 的 复杂 性 。 这 是 真实 的 (也 是 值得 我 们 努 
力 的 ), 但 是 我 们 的 重点 是 区 分 可 解 问题 和 难 解 问题 。 从 这 个 角度 看 ， 算 法 时 间 复 杂 性 的 多 项 式 差 别 
并 不 重要 。 

如 果 工 可 以 在 多 项 式 时 间 归 约 到 Q， 那么 Q 可 能 被 认为 至 少 是 跟 工 一 样 难 的 问题 。 自动 化 地 寻找 
Q 的 解 需要 工 的 解 ; 通过 顺序 地 执行 归 约 得 到 解 ， 随 后 是 Q 的 解 。 此 外 ， 归 约 和 Q 的 解 的 结合 的 时 
间 复 杂 性 说 明 ， 如 果 Q 是 可 解 的 ,那么 工 也 是 可 解 的 。 归 约 和 语言 的 相对 难度 之 间 的 关系 可 以 扩展 到 
语言 类 。 

定义 15.6.3 设 C 是 一 个 语言 类 。 一 个 语言 Q 难 于 类 C， 如 果 C 中 的 每 个 语言 都 可 以 在 多 项 式 时 
间 内 归 约 到 Q。 

如 果 Q 难于 类 人 @ 并 且 在 多 项 式 时 间 内 是 有 解 的 , 那么 类 C 中 的 每 一 个 问题 都 在 多 项 式 时 间 内 有 
fi, HCCP, 


15.7 P= NP? 
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的 标准 图 灵机 能 够 保持 多 项 式 时 间 复 杂 性 。8. 7 节 介绍 了 从 非 确定 型 机 器 的 转换 到 等 价 的 确定 型 机 器 
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的 构造 技术 。 不 幸 地 是 ， 根 据 定理 15. 1. 2 ， 这 个 构造 并 不 能 保持 多 项 式 时 间 复 杂 性 。 

哈密 尔 顿 回路 问题 的 两 个 解法 鲜明 地 说 明了 确定 型 和 非 确定 型 计算 的 不 同 。 为 了 找到 答案 ， 确 定 
型 解法 在 试图 发 现 周 游 中 生成 节点 的 序列 。 在 最 坏 情况 下 ， 这 个 过 程 需要 检查 节点 的 所 有 可 能 包含 图 
的 周游 的 序列 。 非 确定 型 机 器 通过 “猜想 ”一 个 序列 并 判定 其 是 否 能 构成 一 个 周游 来 避免 这 个 过 程 。 
P = NI 问题 的 哲学 解释 是 ， 为 问题 构造 一 个 解 在 本 质 上 是 否 比 检查 一 个 可 能 是 否 满足 了 问题 的 条 件 
更 加 困难 。 由 于 现在 已 知 的 额外 困难 ， 确 定型 解 跨越 非 确定 型 解 涉及 很 大 范围 的 重要 问题 ， 一 般 大 家 
Maa PANP. Kil, P = N? 问题 是 一 个 精确 形式 化 的 数学 问题 ， 并 且 只 有 当 两 个 类 的 等 价 
PHBE NDS 的 结论 被 证 明 后 才能 解决 。 

HEERS P = NP 的 一 个 方法 是 在 独立 的 基础 上 检查 每 一 个 语言 或 者 判定 性 问题 的 属性 。 例 如 ， 
人 们 投入 相当 多 的 精力 试图 提出 一 个 确定 型 多 项 式 算法 来 解决 哈密 尔 顿 回路 问题 。 事 实 上 ， 找 到 这 样 
一 个 解法 仅 能 解决 针对 某 种 语言 的 问题 。 我 们 需要 的 是 一 个 对 于 所 有 NF 了 语言 而 言 能 够 一 次 解决 确定 
型 多 项 式 可 解 性 问题 的 通用 方法 。 对 N 了 类 而 言 ， 语 言 表示 的 困难 使 得 我 们 可 以 把 NP 类 中 所 有 问题 
的 多 项 式 时 间 有 人 解 问题 转换 为 一 个 问题 的 多 项 式 时 间 有 人 解 问题 。 

定义 15.7.1 一 个 语言 Q Æ NP HH (NP-hard)， 如 果 对 于 所 有 Le NP, 世 可 以 在 多 项 式 时 间 
内 归 约 到 Q, NP NP 难 的 语言 也 叫做 NP 完全 的 (NP-complete) 。 

我 们 可 以 把 一 个 NP 完全 的 语言 看 作 是 NP 类 中 的 一 个 通用 的 语言 。 接 收 NP 完全 语言 的 多 项 式 
时 间 机 器 的 发 现 可 以 用 于 构造 在 确定 多 项 式 时 间 内 接收 N? 类 中 所 有 语言 的 机 器 。 也 就 是 说 ， 这 给 出 
TP = N 了 问题 的 肯定 答案 。 

定理 15.7.2 如 果 存 在 一 个 在 中 中 的 NP 完全 语言 ， 那 么 了 = NP 。 

WEBB: 假设 Q 是 一 个 可 以 被 确定 型 图 灵机 在 多 项 式 时 间接 收 的 NP SEI. BL ENP HY 
任意 语言 。 因 为 Q 是 NP 难 的 ， 所 以 存在 从 L 到 Q 的 多 项 式 时 间 归 约 。 根 据 定理 15.6.2, L 也 在 
PA. j Bi 

由 于 图 灵机 可 计算 性 的 概念 和 符号 所 提供 的 精确 性 ，NP 完全 性 的 定义 使 用 了 递归 语言 和 图 灵机 
计算 函数 的 术语 。 递 归 语 言 和 有 解 判定 问题 之 间 的 二 元 性 允许 我 们 描述 NP 难 和 NP 完全 判定 问题 的 
说 法 。 在 判定 性 问题 的 上 下 文中 重新 检查 这 些 定 义 是 值得 的 。 i 

使 用 图 灵机 计算 函数 的 语言 的 归 约 性 是 第 11 章 中 提出 的 判定 的 问题 归 约 概念 的 形式 化 。 一 个 判 
定 问题 是 NP 难 或 NP 完全 的 ， 无 论 解决 这 个 问题 的 机 器 接收 的 语言 是 什么 。 使 用 了 NP 类 问题 到 一 
个 NP 难 问题 的 P 通 用 的 归 约 ， 我 们 可 以 通过 结合 归 约 和 解决 P 的 机 器 获得 任何 一 个 NP 了 问题 的 解 。 

从 语言 或 判定 问题 的 角度 看 ， 不 管 我 们 是 和 否 接近 了 NP 完全 性 ， 显 然 这 都 是 一 类 重要 问题 。 不 幸 
的 是 ， 我 们 还 没有 说 明 这 样 一 个 一 般 问 题 的 存在 。 尽 管 这 需要 很 大 量 的 工作 ， 这 个 遗漏 将 在 下 一 部 分 
弥补 。 


15.8 可 满足 性 问题 


可 满足 性 问题 与 命题 逻辑 中 公式 的 真 值 相 关 ， 它 是 用 于 说 明 NP 完全 的 第 一 个 判定 问题 。 公 式 的 
真 值 可 以 通过 公式 中 的 基本 命题 获得 。 可 满足 性 问题 的 目标 是 判定 是 否 存 在 一 个 使 命题 为 真 的 命题 真 
值 赋值 。 在 说 明 可 满足 性 问题 是 NP 完全 的 以 前 ,我 们 将 简要 地 回顾 一 下 命题 逻辑 的 基础 。 

一 个 布尔 变量 (boolean variable) 是 一 个 值 为 0 或 者 1 的 变量 。 布尔 变 量 可 以 看 作 是 命题 ， 是 命 
题 逻辑 的 基本 对 象 。 变 量 的 值 描述 了 命题 的 真 或 假 。 当 布尔 变量 被 赋值 为 1 时 命题 x 为 真 。 值 0 指派 
了 一 个 假 命 题 。 一 个 真 值 赋值 (truth assignment) 是 对 每 个 布尔 变量 赋值 为 0 或 者 1 的 函数 。 

命题 连接 词 和 人 (C5). V (或 ) 和 (952 C8) 用 于 从 布尔 变量 集 构造 命题 ， 这 些 命题 称 为 合式 
公式 (well-formed formula) 。 我 们 将 使 用 符号 x,y,z 表示 布尔 变量 ,使 用 u,v, w 表示 合式 公式 。 

定义 15.8.1 设 V 是 布尔 变量 的 集合 。 

i) 如 果 xeV， 那 么 x 是 合式 公式 。 

ii) 如 果 U,V 是 合式 公式 ， 那 么 (U) ,( 卫 uu),(uA 作 Vv) 和 (UVV) 是 合式 公式 。 

ii) 一 个 表达 式 是 V 上 的 合式 公式 , 仅 当 它 可 以 从 布尔 变量 集 获得 且 有 限 次 地 应 用 了 步骤 (站) 
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中 的 操作 。 

表达 式 ((9 (xVy) Az). ( ( CeAy) Vz) V^ G9) MCC (4%) Vy) A (xVz)) 是 
布尔 变量 x、y 和 z 上 的 合式 公式 。 我 们 可 以 通过 定义 逻辑 操作 符 的 优选 关系 来 减少 合式 公式 中 圆 括号 
的 数量 。 否 可 以 看 作 是 最 紧密 的 操作 符 ， 随 后 是 与 操作 符 和 或 操作 符 。 此 外 ， 与 和 或 操作 符 的 关联 允 
许 省 略 操作 符 序列 中 的 圆 括 号 。 我 们 可 以 通过 这 些 规则 来 把 写 上 面 的 公式 为 ” (xVy) Az, xAyVz 
Vo2xdáü (2xVy) ^ (xVz))., x 

Abt HY ELE) LGB SE BEY BAS Bl), BR EY PEA ET A 3ELER (8. 26 BD E ARR 
公式 。 我 们 可 以 根据 下 表 中 定义 的 uw 和 v 的 值 的 定义 规则 或 得 公式 -wu、uAv 和 wuVv 的 真 值 。 





如 果 变 量 的 值 可 以 使 得 4 的 值 为 1， 那 么 公式 通过 真 值 赋值 被 满足 。 如 果 两 个 合式 公式 可 以 被 
同样 的 真 值 赋 值 满足 ， 那 么 它们 是 等 价 的。 
一 个 语句 (clause) 是 一 个 变量 或 者 其 否定 形式 的 析 取 构成 的 合式 公式 。 非 否定 的 变量 叫做 正文 
字 (positive literal) ， 否 定 变 量 叫做 负 文字 (negative literal)。 使 用 这 种 术语 ， 那 么 一 个 语句 是 文字 的 
析 取 (disjunction of literal), Ast x Va y, ”xzVzvny 和 xzVzynmnx 是 布尔 变量 集 |x, y, z} 上 的 
语句 。 一 个 公式 是 合 取 范 式 (conjunctive normal form) ， 如 果 其 形式 为 : 
uy Nu, Ni Nu, , 
其 中 每 个 u 是 一 个 语句 。 命 题 逻 辑 的 一 个 经 典 定理 是 每 一 个 合式 公式 都 可 以 转换 为 等 价 的 合 取 范 式 
形式 。 
如 前 所 述 ， 可 满足 性 问题 是 判定 是 否 一 个 合 取 范 式 形式 的 公式 可 以 被 某 些 真 值 赋值 满足 。 以 下 从 
变量 dx, y, z} 上 构造 的 公式 
u=(xVy) A(7yVz) 
v=(xViayV4z)A(xVz) A(^xVoy) 
可 以 被 如 下 的 真 值 赋值 满足 。 
Hp, u 中 的 第 一 个 语句 可 以 被 x 满足 ， 第 二 个 语句 可 以 被 -yy 满足 。v 的 第 一 个 语 
句 可 以 被 所 有 三 个 变量 满足 ， 第 二 个 语句 可 以 被 x 满足 ， 第 三 个 语句 可 以 被 ” y 满 
足 。 公 式 


N= aaa 
e 


wzaoxA(xVy)ACS yVx) 
不 能 被 ! 满足。 此 外 ， 我 们 不 难看 出 w 不 能 被 任何 真 值 赋值 满足 。 

我 们 可 以 通过 检查 每 一 个 真 值 赋值 来 获取 可 满足 性 问题 的 确定 型 解 。 可 能 的 真 值 赋值 的 数量 是 
2”"， 其 中 是 布尔 变量 的 数量 。 这 个 策略 的 应 用 在 本 质 上 是 一 个 为 公式 构造 完整 的 真 值 表 的 系统 方 
法 。 显 然 ， 这 种 穷尽 方式 的 复杂 性 是 指数 级 的 。 然 而 ， 检 查 特定 真 值 赋值 的 方面 的 扩展 工作 随 变量 数 
量 和 公式 长 度 多 项 式 地 增长 。 这 个 发 现 为 设计 能 够 解决 可 满足 性 问题 的 多 项 式 时 间 非 确定 型 机 器 提供 
了 思路 。 

定理 15.8.2 可 满足 性 问题 在 NP 中。 


证 明 : 我 们 首先 为 布尔 变量 集 |x, ;…x|} 上 的 合式 公式 提供 一 种 表示 法 。 我 们 把 。 文字 um 


每 一 个 变量 编码 为 其 下 标的 二 进 制 形式 。 我 们 给 正文 字 编 码 的 最 后 添加 #1， 在 负 文 ”不 in 


字 编 码 的 最 后 添加 如 。 2x, , i40 


变量 编码 的 数量 描述 了 满足 文字 的 布尔 值 。 
我 们 通过 连接 文字 和 表示 合 取 及 析 取 关系 的 符号 对 合式 公式 进行 编码 。 合 取 公 式 形式 的 公式 
CMV 人 CR x, Vx) 
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将 被 编码 为 
1#1 V 1080 ^ 10V 11#1. 
最 后 ， 机 器 的 输入 是 由 公式 中 变量 的 编码 、 拓 以 及 公式 本 身 的 编码 组 成 的 。 上 面 公式 的 输入 字符 串 如 
下 所 示 : 
ISI108IISSVIVIN IOROAISVOVIISI 
È 变量 al < 公式 


一 个 可 满足 性 问题 的 实例 的 表示 是 一 个 字母 表 = 10,1, A, V ,#| 上 的 字符 串 。 语言 Lsii 由 所 有 
二 上 的 所 有 表示 可 满足 的 合 取 范 式 公式 的 字符 串 组 成 。 

一 个 可 以 解决 可 满足 性 问题 的 双 带 非 确定 型 图 灵机 M 的 描述 如 下 : M 使 用 猜想 和 检查 策略 ; 猜 
想 非 确定 地 生成 一 个 真 值 赋 值 。 表 示 公 式 (x,V 9 x) A Co x, VDa) 的 输入 字符 串 初始 化 计算 相应 的 配 
置 ， 以 便 说 明 机 器 的 活动 。 带 的 初始 化 配置 包括 带 1 上 的 公式 表示 和 带 2 的 空白 : 

带 2 BB 
带 1 BIBIORLISELEI V 1080 A 180N 11#1B 

1. 如 果 输 入 不 是 以 上 要 求 的 形式 ， 那 么 计算 停机 并 且 拒 绝 该 字符 串 。 

2. 带 1 上 第 一 个 变量 的 被 拷贝 到 带 2 上 ， 然 后 打印 # 并 且 非 确定 的 写 人 0 或 1。 如 果 该 变量 不 是 最 
后 一 个 变量 ,那么 写 顶 ， 并 且 该 过 程 为 下 一 个 变量 重复 执行 。 非 确定 型 地 为 每 一 个 变量 选择 值 定义 了 
一 个 真 值 赋值 :。 把 该 值 赋 给 变量 x, 表示 为 (x,)。 使 用 这 种 表示 后 ， 带 有 以 下 的 形式 : 

带 2 Bl#t( x, )##10#t( x, )##11#t( x, )B 
带 1 BI#1O#11##1#1 \ 1080 A 180N 11#1B 
带 2 的 带头 被 重新 布置 到 最 左 端 的 位 置 。 带 1 AS BH PS IE A AR EE, 

真 值 赋值 的 生成 是 M 非 确 定性 的 惟一 实例 。 计 算 的 后 续 部 分 将 检查 是 否 公 式 被 非 确定 地 选择 的 
真 值 赋值 所 满足 。 

3. 假设 带 1 上 变量 x, 的 编码 被 扫描 。 那 么 x; 的 编码 在 带 2 上 可 以 被 找到 。 机 器 后 续 的 活动 是 由 
t(x,) SF 2 上 那个 紧 随 带 1 Ex, 的 布尔 值 的 比较 结果 决定 的 。 

4. 如 果 值 不 匹配 ， 那 么 当前 的 文字 不 能 被 真 值 赋 值 满足 。 如 果 文 字 后 续 字 符 是 B 或 者 和信， 那么 当 
前 语句 中 的 每 个 文字 都 已 经 被 检查 并 且 以 失败 告终 。 当 这 种 情况 发 生 时 ， 真 值 赋值 不 能 满足 公式 并 且 
计算 停机 在 不 接收 状态 。 如 果 读 和 人 的 是 人 ， 那 么 带头 被 布置 以 便 检 查 语句 中 的 下 一 个 文字 (步骤 3)。 

5. 如 果 值 不 匹配 ， 那 么 文字 和 当前 的 语句 不 能 被 真 值 赋值 满足 。 带 1 的 带头 向 右 移动 至 下 一 个 人 
或 者 B。 如 果 遇 到 8B， 那 么 计算 停止 并 接收 输入 ， 否 则 ， 返 回 步骤 3 处 理 下 一 个 语句 。 

步骤 3 的 匹配 过 程 决 定 了 计算 的 时 间 复 杂 性 的 增长 速度 。 在 最 坏 的 情况 下 ， 匹 配 过 程 需要 比较 带 
1 上 的 变量 和 带 2 上 的 每 一 个 变量 ， 以 便 能 够 发 现 匹 配 。 这 可 以 在 OCKk - nn) 时 间 内 完成 ， 其 中 是 变 
量 的 数量 , 大 是 输入 中 文字 的 数量 。 E 

MERILU Loari NP 难 的 ， 也 就 是 说 ，Ny 中 的 每 一 种 语言 都 可 以 在 多 项 式 时 间 可 归 约 
到 Lf. 首先 ， 这 看 上 去 像 是 一 个 不 可 能 的 任务 。NP 中 有 无 穷 多 种 语言 ， 它 们 似乎 很 少 有 共性 ， 
它们 其 至 没有 被 限制 用 同样 的 字母 表 。 NF 了 语言 的 惟一 共同 特性 是 它们 都 能 被 多 项 式 时间 边 界 的 非 确 
定型 图 灵机 接收 。 不 幸 地 是 ， 这 远 远 不 够 。 除 了 考虑 到 语言 ， 证 明 还 将 揭示 可 以 接收 语言 的 机 器 的 属 
性 = 在 这 种 情况 下 ， 我 们 可 以 用 一 个 通用 的 过 程 把 NP 了 P 中 的 任意 一 种 语言 归 约 到 Lus. 

定理 15. 8.3 ( 库 克 定理 ) 可 满足 性 问题 是 NP 难 的 。 

WEBB: 设 工 是 可 以 被 非 确定 型 图 灵机 M 接收 的 ， ELM 的 计算 边界 是 多 项 式 p。 可 满足 性 问题 的 L 
的 归 约 可 以 把 M 计算 的 输入 4 转换 为 合 取 范式 公式 f(u) ， 从 而 使 得 weL(M) 当 目 仅 当 f(u) 是 可 满 
足 的 。 接 下 来 我 们 将 说 明 构 造 f(w) 所 需要 的 时 间 仅 随 u 的 长 度 多 项 式 地 增长 。 

在 不 损失 一 般 性 的 情况 下 ,我们 假设 所 有 M 的 计算 在 一 个 或 两 个 状态 内 停机 。 所 有 接收 计算 在 
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状态 g 停机 ， 所 有 不 接收 计算 在 状态 dr 停机 。 此 外 ， 我 们 假设 其 他 状态 不 存在 转换 。 通过 添加 每 一 
个 接收 配置 到 g 的 转换 和 每 一 个 拒绝 配置 到 gx 的 转换 ， 任 意 一 个 机 器 都 可 以 转换 为 与 之 等 价 并 满足 
以 上 条 件 的 机 器 。 这 种 变化 在 原 机 器 的 每 一 个 计算 上 都 增加 了 一 个 转换 。 从 计算 到 合式 公式 的 转换 ， 
假设 了 所 有 输入 长 度 为 n 的 计算 包括 p(n) 中 配置 。 如 果 有 必要 的 话 ， 为 了 保证 正确 数量 的 配置 出 现 ， 
终止 配置 将 被 重复 。 
M 的 状态 、 停 机 状态 和 字母 表 表示 为 : 
Q= fosti saal 


EE ET N T T E, A 
2 = la; 51,2578, 
R= tq, i's 


我 们 假设 空白 是 编号 为 0 的 带 字符 。 输 入 字母 表 包括 了 编号 从 s+1 到 c 的 带 字 母 表 的 元 素 。 惟 一 的 接 
收 状态 是 g, ARSE 9。_i。 

Bue 有 “是 长 度 为 n 的 字符 串 。 我 们 的 目标 是 定义 一 个 公式 fu) ， 这 个 公式 能 够 对 M 计算 的 输 
和 编码。f(u) 的 长 度 依赖 于 输入 长 度 为 n 时 M 计算 的 最 大 转换 次 数 p(n)。 我 们 设计 这 样 一 个 编码 ， 
使 得 存在 一 个 真 值 赋 值 满足 f(u) 当 且 仅 当 weL(M)。 公 式 是 根据 三 类 变量 构造 的 ， 每 一 类 都 用 于 表 
示 某 种 机 器 配置 的 属性 。 











变量 解释 ( 满足 时 ) 

a5 pba, 时 间 为 时 ，MM 在 状态 4 
Ozksp(n) 

Pj 0<j<p(n) 时 间 为 上 时 ，M 正在 扫描 位 置 j 
0<k<p(n) 
0<j<p(n) 


时 间 为 上 时 ， 带 上 的 7 位置 包含 符号 w 


O<rst 


0<k<p(n) 





变量 集合 V 是 上 表 中 定义 的 三 个 集合 的 并 集 。M 的 计算 定义 了 V 的 一 个 真 值 赋值 。 例 如 ， 如 果 
初始 时 带 位 置 3 包含 符号 a;， 那 么 9,o 为 真 。 同 时 对 所 有 TAs, Ss MMA. ARG 
真 值 赋值 描述 了 状态 、 带 头 位 置 和 时 间 Kk(0<k<p(n) ) 时 带 上 的 字符 。 这 是 计算 生成 的 配置 序列 的 详 
细 信 息 。 

对 V 中 变量 的 任意 一 个 真 值 赋值 都 不 必 与 M- 的 一 个 计算 对 应 。 给 Pus 和 Pi 同时 赋值 为 1 表示 时 
间 为 0 时 带头 在 两 个 截然 不 同 的 位 置 。 类 似 的 ， 一 个 真 值 赋值 可 能 描述 了 机 器 在 某 个 给 定 的 时 间 处 于 
几 个 状态 或 者 在 某 个 位 置 指派 了 多 个 符号 。 

公式 f(w) 应 该 说 明 为 了 保证 变量 的 解释 与 通过 计算 中 真 值 赋值 得 到 的 是 相同 的 所 需要 的 约束 条 
iko 我们 根据 M 输入 字符 串 u 和 转换 定义 了 八 个 公式 集合 。 这 八 个 公式 集合 中 的 七 个 是 以 语句 的 形式 
给 出 的 。 我 们 可 以 以 图 灵机 配置 和 计算 的 形式 来 简要 地 描述 他 们 的 解释 ,语句 可 以 通过 这 些 描 述 获 
得 。 下 面 这 两 种 记 法 


分 别 表示 了 文字 v, v, vov, 的 合 取 和 析 取 。 

. 一 个 满足 下 表 中 (i) 定义 的 语句 集合 的 真 值 赋 值 表示 机 器 每 次 只 处 于 一 个 状态 。 满 足 第 一 个 合 
取保 证 了 至 少 一 个 Q ,中 的 变量 为 真 。 否 定 对 表示 两 个 状态 不 可 能 同时 满足 。 最 简单 的 这 种 情况 是 ， 
使 用 蕴含 ASB 的 等 价 析 取 形式 =- AVB 把 -QV 一 Qi 4 转换 为 其 蕴含 的 形式 , 我们 把 Qi V2 Qs 
ERAS Qua Qy ,后 者 可 以 被 解释 为 一 个 断言 ,这 个 断言 检查 对 于 任意 的 让 关 i, 机 器 在 时 间 上 时 
是 否 处 于 状态 q; M qro 
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B 名 条 件 解释 (满足 时 ) 
i) 状态 
V Qa 0<k<p (n) 每 次 时 间 为 上 时 M 至 少 在 一 个 状态 
iz0 B 
Oxici'x 
~ Qia V^ Qs cipis s M 至 少 在 一 个 状态 (现在 同时 共有 两 种 不 同 的 状态 ) 
0<k<p (n) 
i 带头 位 置 
p(n 
Ve, O<k<p (n) 每 次 时 间 为 上 时 带头 至 少 在 一 个 位 置 
jeo h 
0<j<j’<p (n) 
PRM = Py, eke as 最 多 一 个 位 置 
ii) 带 上 符号 
j 0<j<P (n) a Sh ee P^ 
V Sire Sn FEKE kAj, 位 置 j 包 括 至 少 一 个 符号 


0<j<P (n) 
7 Sine V7 Sip Ozr«r'xt 最 多 一 个 符号 
Oxkzp (n) 


iv) MB usa, , a, , a, 的 初始 条 件 


Qo,o 
Po 计算 开始 读 最 左边 的 空白 
Soo 0 
Si,n,0 时 间 为 0 时; 字符 串 u 在 输入 位 置 
Soin 0 
Sarg 0 
S, *1,0,0 
时 间 为 0 时 ， 带 的 其 余部 分 是 空白 
Spo) ,0,0 
v) 接受 条 件 
Qu p(n) 计算 的 停机 状态 是 Im 


因为 输入 为 n 时 M 的 计算 不 能 访问 带 上 p(n) 以 外 的 位 置 ， 因 此 二 个 机 器 配置 完全 是 通过 状态 、 
带头 位 置 和 带 上 初始 位 置 p(n) 的 内 容 来 定义 的 。 一 个 满足 (i) , (ii) 和 (这 ) 语 句 的 真 值 赋值 给 0 和 p(n) 
之 间 的 每 个 时 间 都 定义 了 一 种 机 器 配置 。 语 句 (i) 和 (ii) 的 合 取 说 明 机 器 每 次 处 于 一 个 状态 且 扫 描 带 上 
的 一 个 位 置 。( 诞 ) 中 的 语句 保证 了 带 是 定义 良好 的 ; 也 就 是 说 ， 带 在 每 个 位 置 定义 一 个 字符 ， 计 算 过 
程 中 这 个 字符 会 被 引用 。 

一 个 计算 不 包含 不 相关 配置 的 序列 ， 而 是 那些 在 一 个 转换 后 能 与 其 前 驱 有 所 区 分 的 配置 序列 。 
我 们 必须 添加 那些 满足 条 件 描述 了 时 间 0 时 的 配置 并 且 连 接 到 连续 的 配置 的 语句 。 最 初 ， 机 器 处 于 
状态 g ， 带 头 扫描 最 左边 的 位 置 ， 输 入 位 于 带 上 1 到 位 置 ， 并且 带 上 剩余 的 部 分 都 是 空白 。(iv) 中 
p(n) +2 语句 的 满足 条 件 保证 了 时 间 为 0 时 正确 的 机 器 配置 。 

通过 实施 一 个 转换 ， 每 一 个 后 续 的 配置 都 必须 从 其 后 续 得 到 。 假 设 机 器 处 于 状态 4 ， 在 时 间 大 时 
正在 扫描 位 置 j 处 的 字符 a,。 我 们 介绍 最 后 三 类 公式 ,根据 机 器 M 的 转换 和 时 间 天 时 定义 的 变量 来 生 
成 时 间 k+1 时 允许 的 配置 。 

带 上 一 个 转换 的 影响 是 重 写 带头 扫描 的 位 置 。 考 虑 到 位 置 P; 可 能 的 异常 ， 时 间 k+1 时 每 一 个 带 上 
的 位 置 都 包含 了 与 时 间 上 时 相同 的 字符 。 语 句 必须 被 添加 到 公式 中 以 保证 带 上 其 余 的 部 分 不 被 转 
换 影 响 。 
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i A 条 件 解释 (满足 时 ) 
(vi) 带 一 致 性 : 
O0<j<p (n) 
T Sire VP EV Srl O<rst 不 在 带头 位 置 的 符号 不 会 改变 
Ozkzp (n) 


如 果 带 上 一 个 位 置 发 生 改变 而 且 不 是 被 扫描 的 带头 位 置 ， 那 么 这 个 语句 不 能 被 满足 。 这 也 就 是 
^S, VP, V'S ren 
等 价 于 
FPS) pS) eer) 

这 清晰 地 说 明了 如 果 时 间 k 时 带头 不 在 位 置 j， 那 么 时 间 k+1 时 位 置 j 的 符号 跟 时 间 k 时 位 置 j 的 符号 
相同 。 

现在 假设 在 给 定 的 一 个 时 间 k， 机 器 处 于 状态 q; 并 正在 扫描 位 置 / 处 的 字符 a,。 通 过 把 布尔 变量 
Ques P, RI Sr 赋值 为 1 可 以 指派 一 个 配置 的 这 些 特征 。 当 Q; ,1 为 真 时 语句 (a) 可 以 被 满足 。 在 计 
算 时 ， 这 意味 着 M 在 时 间 k+1 时 进入 了 状态 go KWM, HEE k+l 时 位 置 j 处 的 符号 和 带头 位 置 由 
语句 (b) MA (c) 描述 。 其 中 n(L) = -1 且 n(R)=1。 

a) ^ Qi Va Pi. Va Sire V Qi 

b) ^ Qi Va Pi, Va Sii V Sip 

e) Q;, Vn Pi, Va Sia V Py tay kaa , 

语句 (a), (b) Al (c) 的 合 取 能 够 被 满足 ， 仅 当时 间 大 +L 时 的 配置 是 通过 实施 一 个 转换 [4 , 
a,' ,d] e 6(9g;,a,) 从 时 间 k 时 的 配置 中 得 到 的 。 

我 们 可 以 用 转换 的 语句 表示 来 构造 一 个 公式 ， 这 个 公式 的 满足 能 够 保证 时 间 k+1 时 配置 中 定义 
的 变量 是 通过 M 实施 一 个 转换 从 时 间 大 时 定义 的 配置 中 得 到 的 。 除 了 状态 q, Manis M 的 约束 保证 
了 给 每 个 状态 和 每 个 字符 对 都 至 少 定义 了 一 个 转换 。 


合 取 范式 公式 
(= Qu Va P, V^ Sirk V Qin ) (新 状态 ) 
人 (= Qi Va Pj, Va Sis V Pj. stay kel ) (新 带头 位 置 ) 
人 (= Qi V^ Pp, V^ S V Sra) (位 置 r 处 的 新 符号 ) 
是 针对 每 个 

0<k<p(n) (时 间 ) 
O<i<m-1 ( 非 停机 状态 ) 
0<j<p(n) (带头 位 置 ) 
0<r<t ( 带 符号 ) 


构造 的 ， 其 中 [ g,',a,',4d] e 6(9g;,a,)， 除 非 位 置 是 0 并 且 方 向 工 是 由 一 个 转换 描述 的 。 当 一 个 转换 的 
实施 会 导致 带头 穿 过 带 的 左边 界 时 这 种 异常 状况 会 发 生 。 以 语句 的 形式 看 ， 这 表示 后 续 配 置 包括 拒绝 
状态 q,_1。 这 种 特殊 情况 由 以 下 公式 编码 
(^ Qi Va Pox Va S, V Q, ia ) (进入 拒绝 状态 ) 
A Qik My Po ya Sor V P, ) (同样 的 带头 位 置 ) 
NES QO. Va P, Va So. V So. ks ) ( 同样 的 位 置 r 处 的 符号 ) 
其 中 对 于 所 有 转换 都 有 [qg a, L] e6( gi,a,)。 

由 于 M 是 非 确定 型 的 ， 所 以 存在 一 些 能 够 用 于 给 定 配置 的 转换 。 任 何 一 个 这 种 变化 的 结果 都 是 
计算 中 允许 的 后 续 配 置 。 设 trans(i,j,r,k) 是 一 个 表示 状态 q 中 的 时 间 上 ， 带 头 位 置 在 7， 带 上 符号 r 
的 所 有 合 取 范式 的 析 取 。 公 式 trans(i,j,r,k) 才 能 被 满足 ， 仅 当时 间 k+1 时 配置 编码 的 变量 的 值 表示 
时 间 大 时 配置 编码 的 变量 的 一 个 合法 后 续 。 
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公 -- 式 解释 (满足 时 ) 
vi) 生成 后 续 配 置 转换 mans (i, j, r, k) 通过 实施 一 个 转换 ， 配 置 (k-1) 紧 随 配置 之 后 . 
—— mE EIR, BOBO (CK +1) KEE KR Sie 


当 机 器 处 于 停机 状态 dn 成 q, IE, ASC trans(i,j,r;k) 不 描述 将 要 发 生 的 动作 .在 这 种 情况 下 ， 
后 续 的 配置 与 其 前 驱 相 同 . 





公 式 解释 (满足 时 ) 
vi) 停机 计算 
ue Vee M sie Modes (同样 的 状态 ) 
Gig Vosa, Ves s NEU. (同样 的 带头 位 置 ) 
200 VARIES M (位 置 > 处 同样 的 符号 ) 


TP EARE eC UDIN MUI E 

Wf (u) (i) A( viii) 构造 的 语句 的 合 取 公 式 。 当 产 ( 轨 被 一 个 V 上 的 真 值 赋值 满足 时 ， 这 些 变量 
就 定义 了 M 的 接收 字符 串 的 计算 。 条 件 (iv) 的 语句 说 明 时 间 0 时 的 配置 是 输入 为 的 M 的 计算 的 
初始 配置 。 每 一 个 后 续 的 配置 都 通过 其 前 驱 实 施 一 个 转换 的 结果 得 到 。 由 于 (v) 的 满足 条 件 表 示 最 终 
的 配置 包括 接收 状态 g,， 因 此 机 器 M 接收 字符 串 us 

我 们 可 以 利用 引 理 15. 8. 4 介绍 的 技术 将 每 个 trans (i,j,r,k) 公式 转换 为 合 取 范式 ， 从 而 可 以 从 
(4) 得 到 合 取 范 式 公 式 f(u) 。 下 面 将 说 明 从 字符 串 we X * 到 了 (wu) 的 转换 可 以 在 多 项 式 时 间 内 完成 。 

从 uu 到 f(u) 的 转换 包含 构造 语句 和 把 trans 转换 为 合 取 范式 。 语句 的 数量 是 下 列 内 容 的 函数 

i) 状态 的 数量 m 和 带 字符 的 数量 t, 

i) 输入 字符 串 u 的 长 度 n， 以 及 

iii) M 计算 长 度 的 边界 p(n)。 

m 和 + 的 值 可 以 通过 图 灵机 M 获得 ， 并 且 它们 与 输入 字符 审 无 关 。 从 下 标的 范围 我 们 可 以 看 到 ， 
语句 的 数量 在 多 项 式 p(n) 内 。f(u) 的 建立 可 以 通过 转换 成 合 取 范 式 来 完成 ， 根 据 引 理 15. 8;4， 这 是 
公式 trans(i,j,r,k) 中 语句 数量 的 多 项 式 。 

我 们 已 经 知道 合 取 范式 公式 可 以 在 一 定 的 步骤 内 完成 ， 步骤 的 数量 随 着 输入 字符 串 长 度 做 多 项 式 
地 增长 。 我 们 真正 需要 的 是 作为 解决 可 满足 性 问题 的 图 灵机 输入 的 表示 。 任 何 合理 的 编码 ， 包 括 定理 
15. 8. 2 的 编码 方式 ， 把 高 层 表 示 转 换 为 机 器 表示 都 只 需要 多 项 式 时 间 。 pn] 

上 面 的 证 明 遗 漏 了 将 公式 trans(i,j,r,k) 转 换 为 合 取 范式 的 步骤 。 下 面 的 引 理 将 说 明 任 何 合 取 范 式 
公式 的 析 取 都 可 以 在 多 项 式 时 间 内 被 转换 为 合 取 范 式 。 

引 理 15.8.4 设 u=w,Vw,V…Vw, 是 布尔 变量 集 V 上 合 取 范式 公式 Ww， ，w,，…，w, 的 析 取 形 
式 。 同 时 ， 设 V =VU lx. 3, e, mah 其 中 变量 y, 不 在 V 中 。 公式 到 可 以 被 转换 为 V' 上 的 公 
Ku, 使 得 

i) RARAN; 

i) uw' 在 V' 是 可 满足 的 ， 当 且 仅 当 , wu 在 V 上 是 可 满足 的 ;， 并且 

be se dt ee HP mew Piss) HRS, 


WERA: 合 取 范式 公式 的 析 取 的 转换 已 经 给 出 。 这 个 技术 可 以 被 重复 n -1 KEREK n AA 
式 的 析 取 。 3 u zw, Vw; 是 两 个 合 取 范式 公式 的 析 取 ， 那 么 w, Mw, 可 以 写 为 
W,- 人 ( V Vj.) 


= 人 
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其 中 六 是 w 中 语句 的 数量 ，s 是 w 中 第 7 个 语句 的 文字 数量 , 4 是 w 中 第 六 个 语句 的 文字 数 
量 。 定 义 
w= Nov M vo^ A Gyv V pa. 
ASK u^ 可 以 通过 分 派 y 到 w 中 的 每 一 个 语句 和 分 派 ” y 到 w, 中 的 每 一 个 字句 得 到 。 
现在 我 们 证 明 无 论 z 是 什么 ,xz 都 是 可 满足 的 。 假 设 w 可 以 被 V 上 的 真 值 赋 值 满足。 那么 真实 
赋值 能够 满足 u'o 
i : t(x) WRxev 
“= 如 果 交 =?》 
X w, 可 被 1 满足 时 ， 真 实 赋 值 ?可 以 通过 扩展 1 设 +(y) =1 得 到 。 
MZ, 假设 w' 能 够 被 真 值 赋值 i 满足， 那么 + 对 V 的 约束 满足 uw。 如 果 t(y) 20, 那么 ww 一 定 为 
真 。 另 一 方面 ， 如 果 t(y) =1， 那 么 w, 为 真 。 
下 面 的 转换 
u-w,Vw,V:- Vw, 
HR WU bate n -1 次。 这 种 重复 在 w, Mw, 的 每 个 语句 中 添加 了 7- 工 个 文字 ， 在 w, 的 每 
个 语句 中 添加 了 和 -2 个 文字 ,在 w, 的 每 个 语句 中 添加 了 n -3 个 文字 ， VR dare 
BRD msn’, Ikik m 是 公式 wi ,w,;…,w, 的 语句 数量 。 


15.9 复杂 类 的 关系 

我 们 在 本 章 的 最 后 介绍 两 个 图 ， 这 两 个 图 说 明了 前 面 介绍 的 
复杂 类 之 间 可 能 存在 的 关系 。 包 含 了 所 有 NP 完全 问题 的 类 叫做 
NPC ， 可 满足 性 问题 的 存在 保证 了 这 个 类 是 非 空 的 。 

MRP ANP, WAP A NPC 都 是 非 空 的 ， 都 是 NP 的 子 
集 。 大 多 数 数学 家 和 计算 机 界 的 科学 家 都 相信 这 种 假设 是 真 的 。 


另 一 种 不 太 可 能 的 情况 是 了 确实 等 于 NP ， 那 么 这 两 个 集合 将 合 17V 
并 为 一 个 集合 。 练 习 17 要 求 你 在 这 种 可 能 的 情况 下 确定 NP 完全 


问题 的 集合 
15. 10 练习 
1. WM 是 图 灵机 
a/aR a/a L a/a R 
/BR a/a Ey a/a Ee 
QAO“ 


a) 跟踪 输入 为 ,a,aa 时 M 的 所 有 计算 。 
b) 描述 输入 为 a" 时 M 的 计算 所 要 求 的 最 大 转换 次 数 。 
c) 给 出 函数 te e 

2. 设 M 是 图 灵机 


[xx R, B/x R] [x/x R, B/B S] [xx L, x/x L] 


M: (4) [B/B R, B/B R] A [a/# R, B/B S] A [B/B L, B/B L] ^ [#/# S, B/B S] 





[493] 


288 (| wm HFA Zl 





其 中 x 表示 a 或 者 b。 
a) 跟踪 输入 为 bbabb 时 M 的 计算 。 
b) 给 出 M 的 语言 的 集合 论 定义 。 
c) 什么 样 的 长 度 为 n 的 字符 串 会 导致 最 多 次 转换 ? HHA? 
d) 给 出 函数 tcw。 
3. 说 明 类 了 对 于 并 、 连 接 和 补 计算 是 闭 包 的 。 
4. us N 了 类 对 于 并 ,连接 和 克 林 星 运算 是 闭 包 的 。 


. 设 L=(R(M)w| M 接收 w 最 多 执行 2””” 次 转换 ) 


a) 证 明 工 不 在 内 。 提 示 : 利用 了 在 补 运算 上 的 闭 包 证 明 。 如 果 工 在 了 内 ， 那么 存在 一 个 图 灵 
机 M' 能 够 接收 M 的 所 有 RCM) KR, HE M 不 在 2”**W) 次 转换 内 接收 它们 自己 的 表示 。 
然后 使 用 自 引 用 可 得 到 冲突 。 
b) WEH L RE NP A, 
6. 请 设计 一 个 双 带 图 灵机 ， 使 之 能 把 一 元 数字 转换 为 二 进 制 数字 。 试 确定 该 机 器 的 时 间 复 杂 性 。 
7. 请 设计 一 个 双 带 图 灵机 ， 使 之 能 把 二 进 制 数 字 转 换 为 一 元 数字 。 请 解释 为 什么 该 转换 不 能 在 多 项 式 
时 间 内 完成 。 
8. 设 P 是 一 个 输入 包含 自然 数 的 判定 问题 ，M 是 一 个 使 用 二 进 制 表示 法 在 多 项 式 时 间 内 能 解决 P 的 


图 灵机 。 请 使 用 M 设计 一 个 机 器 ， 使 之 能 使 用 3 为 基数 的 自然 数 表示 法 解决 P。 请 说 明 该 解法 也 是 
多 项 式 的 。 


“9. BEM 是 一 个 非 确定 型 图 灵机 ，p 是 一 个 多 项 式 。 假 设 L(M) 的 每 一 个 长 度 为 n 的 字符 串 都 能 在 至 


少 一 个 p(n) 计算 或 者 更 少 的 转换 内 被 接收 。 请 注意 没有 关于 不 接收 计算 或 其 他 接收 计算 的 长 度 
说 明 。 证明 L(M) 在 NP 了 内。 

10. 请 构造 一 个 确定 型 图 灵机 ， 使 之 能 在 多 项 式 时 间 内 将 语言 L 归 约 到 Q。 请 使 用 大 0 表示 法 给 出 该 
机 器 计算 下 列 归 约 的 时 间 复 杂 性 。 


a) a be | i0, j20| Q= la'c' | iz0| 
b) L={a' (bb)'| iz0| Q= jaci | iz0] 
c) L={a'b‘a'| iz0| Q= |c'd' | iz0| 


11. 机 器 R 能 够 执行 一 个 多 项 式 时 间 归 约 ， 把 语言 L -aa(aUb) ' 归 约 为 语言 Q=ccc(cUd) "。 


a/c R 
b/dR 





a/d R c/c L 
b/dR d/dL 


a) 请 分 别 跟踪 输入 字符 串 为 aabb 和 abbb 时 R 的 计算 。 
b) 什么 样 的 长 度 为 n 的 字符 串 可 以 导致 R 执行 最 多 次 转换 ? 为 什么 ? 
c) 给 出 时 间 复 杂 性 函数 tc, (n) 。 
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12. 机 器 R 





x € (a, bj B/BL 
afc L 
b/d L 
HAM a,b] “到 |c,dj ”的 函数 。 
a) 使 用 上 符号 跟踪 输入 字符 串 为 abba 时 R 的 计算 。 
b) 什么 样 的 长 度 为 n 的 字符 串 会 导致 R 执行 最 多 次 转换 ? 为 什么 ? 
c) 给 出 tcs(n)。 请 用 公式 并 解释 为 什么 你 给 出 的 公式 是 正确 的 。 
d) 机 器 R 是 否 能 把 语言 L=abb(aUb)“ 归 约 到 语言 Q=(cUd)cdd*? 如 果 能 ,证 明 R 计算 的 函 
数 是 一 个 归 约 。 如 果 不 能 ， 请 给 出 一 个 字符 串 说 明 这 种 映射 不 是 归 约 。 
13. 请 给 出 满足 下 列 每 个 公式 的 真 值 赋值 : 
a) (xVyV5 z) A(2xVy) A( xV 8 yV 5a) 
b) (2a xVyV5z)A(xVa y) AON az) ANAC xV a yVz) 
c) (xVy) A( 9 xV 5 yVz) A(xV Sz) AC 3 yV 72) 
14. 请 说 明 公 式 (xV 5 y) ACS xVz)A(yV 5 2) A(CSoxVoS y) AOV ÆSIR. 
15. 请 在 {x,y,z} 上 构造 四 个 语句 ， 使 得 它们 中 任意 三 个 的 合 取 是 可 满足 的 ， 而 所 有 四 个 的 合 取 是 不 可 
满足 的 。 
16. 证 明 公式 必 是 可 满足 的 ， 当 且 仅 当 x 是 可 满足 的 。 
a) uzv, u' (vVyVz) A (vWVayVz) ^ (vWVyVaz) ^ (vV5yV^2z) 
b) uzvVw, = (vVwVy) ^ (vVwVa^y) 
17. 假设 = NP 
a) 设 工 是 一 个 NI 'rBij—^4-i&zs,Lsz09HLz90, muB LE NP 完全 的 。 
b) 为 什么 NPC 是 NP 的 真子 集 ? 495 
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第 16 章 NP- 完全 问题 


我 们 通过 关联 图 灵机 计算 和 合式 范式 公式 说 明了 可 满足 性 问题 是 NP- 完全 的 。 如 果 每 一 个 NP- 完 
全 性 证 明 都 需要 设计 这 种 灵巧 的 转换 ， 那 么 很 多 NP- 完 全 的 问题 都 需要 证 明 。 幸 运 地 是 ， 问 题 归 约 为 
我 们 提供 了 一 种 可 选 的 ， 通 常 也 是 简单 的 证 明 问 题 是 NP- 完 全 的 方法 。 将 一 个 NP- 完 全 问题 归 约 为 另 
外 一 个 NP 中 的 问题 就 证 明了 后 一 个 问题 是 NP- 完 全 问题 。 使 用 这 个 技术 ， 我 们 可 以 从 一 组 规则 中 获 
得 问题 的 NP- 完 全 性 结果 。 此 外 ， 我 们 还 扩展 NP- 完 全 性 的 表示 来 最 优化 问题 。 

一 旦 一 个 问题 被 证 明 是 NP- 完 全 的 ， 那么 试图 发 现 多 项 式 时 间 解 几乎 是 不 可 能 成 功 的 。 相 比 寻 找 
解决 问题 的 高 效 算法 ， 遇 到 NP- 完 全 问题 时 采用 不 同 的 策略 更 加 可 行 。 一 个 可 选 的 策略 就 是 设计 一 个 
平均 时 间 复 杂 性 好 、 但 是 某 些 情况 会 表现 出 指数 级 性 能 的 算法 。 在 最 优化 问题 时 ， 接 收 一 个 近似 最 优 
解 可 能 会 减 小 问题 的 时 间 复 杂 性 。 在 本 章 的 最 后 ， 我 们 将 介绍 遇 到 NP- 完 全 问题 时 可 以 考虑 的 可 
选 策略 。 


16.1 归 约 和 NP- 完 全 问题 


一 个 语言 是 NP- 完 全 的 要 具备 两 个 条 件 : 问题 必须 在 NP 内 且 必 须 是 NP- 难 的 。 满 足 前 一 个 条 件 
的 最 一 般 方式 是 简单 地 设计 一 个 能 在 多 项 式 时 间 内 解决 问题 的 非 确 定型 算法 。 为 了 证 明 语言 L 是 NP- 
MEAS, 证明 NP 了 中 的 每 种 语言 都 能 在 多 项 式 时 间 归 约 到 工 是 必要 的 。 在 做 这 种 归 约 时 ,我 们 不 是 直接 
WERE L 的 归 约 ， 而 是 把 另外 一 个 已 知 的 NP- 完全 问题 作为 中 间 步 骤 。 

定理 16.1.1 设 Q 是 一 个 NP- 完 全 语言 。 如 果 Q 可 以 在 多 项 式 时 间 归 约 到 L， 那 么 L 是 NP- 
难 的 。 

证 明 : 设 * 是 在 多 项 式 时 间 内 将 Q 归 约 到 工 的 计算 函数 ， 设 Qi 是 XN 了 中 的 任意 一 种 语言 。 由 于 Q 
是 NP- 完 全 的 ， 因 此 存在 一 个 能 够 将 Q 归 约 到 Q 的 计算 函数 gj。 复合 函数 og 是 Q BL MIAN, 
归 约 的 多 项 式 时 间 边 界 可 以 通过 = 和 g; 的 边界 获得 。 a 

通过 归 约 证 明 一 种 语言 是 NP- 难 的 复合 可 以 表示 为 如 下 图 所 示 的 包含 两 个 步骤 的 过 程 : 


Q Qe Q NP 语言 
g 
a 8i 


r 


=- 完全 语 


ni 


L 

第 一 个 层次 表示 NP 中 任意 语言 Q 通过 函数 8 到 Q 的 多 项 式 时 间 可 归 约 性 。 从 Q 到 工 的 箭头 表示 
NP 中 任意 语言 到 工 的 可 归 约 性 。 如 果 计 算 g, 和 的 机 器 的 时 间 复 杂 性 分 别 是 O(n’) M1 O(n') , ABA 
复合 函数 ro g, 的 时 间 复 杂 性 就 是 O(n")， 并 且 从 Q BIL 的 归 约 可 以 在 多 项 式 时 间 内 完成 。 在 下 面 三 
个 部 分 中 ， 我 们 将 使 用 定理 16. 1. 1 介绍 几 个 额外 的 NP- 完 全 问题 。 
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16.2 三 元 可 满足 性 问题 


三 元 可 满足 性 问题 是 NP- 完 全 的 可 满足 性 问题 的 子 问题 。 一 个 公式 叫做 三 元 合 取 范 式 (3-con- 
junctive normal form) ， 如 果 它 是 一 个 合 取 范 式 且 每 个 语句 正好 包含 三 个 文字 。 三 元 可 满足 性 问题 的 目 
标 是 确定 是 否 存在 一 个 可 满足 的 三 元 合 取 范 式 公 式 。 

使 用 第 11 章 介 绍 的 归 约 描述 ， 证 明 三 元 可 满足 性 问题 是 NP- 难 的 所 需 的 条 件 如 下 : 











H5 输 入 条 件 
可 满足 性 合 取 范式 公式 u u 是 可 满足 的 
到 当 且 仅 当 
三 元 可 满足 性 三 元 合 取 范 式 公 式 u' 此 是 可 满足 的 


也 就 是 说 ， 归 约 必须 是 从 任意 一 个 合 取 范式 公式 到 某 个 满足 上 述 条 件 的 三 元 合 取 范式 公式 。 此 外 ，u 
的 构造 必须 能 够 在 u 长 度 的 多 项 式 时 间 内 完成 。 

定理 16.2.1 三 元 可 满足 性 问题 是 NP- 完全 的 。 

证 明 : 显然 ， 三 元 可 满足 性 问题 在 N? 内。 对 任意 的 合 取 范式 公式 而 言 ， 解 决 可 满足 性 问题 的 机 
器 对 其 子 集 三 元 合 取 范式 公式 也 能 解决 可 满足 性 问题 。 

我 们 必须 说 明 每 一 个 合 取 范 式 公式 u =w, Vw, V… Vw, 可 以 被 转换 为 一 个 三 元 合 取 范式 公式 us 


从 而 使 得 是 可 满足 的 当 且 仅 当 w' 是 可 满足 的 。w' 的 构造 可 以 通过 将 u 中 每 个 语句 w 独立 地 转换 为 一 . 


个 三 元 合 取 范式 公式 w,' 来 完成 。 这 个 转换 必须 设计 成 能 够 保证 w,' 是 可 满足 的 当 且 仅 当 存在 一 个 真 值 
赋值 满足 原来 的 语句 w;。 我 们 假设 添加 到 语句 转换 中 的 变量 不 在 w; 以 外 的 其 他 地 方 出 现 。 
WR w 有 三 个 文字 ， 那 么 不 需要 转换 即 有 w = ws Kw 是 4 的 语句 且 不 包含 三 个 文字 。 从 w 到 
三 元 合 取 范式 公式 的 转换 基于 w 中 文字 的 数量 : 
长 度 1: w=v, 
WwW =(wVyVz)ACVnyVz)ACVVnz)AGVn7Vnz) 
长 度 2: wev, Vy, 
w'z(wVv Vy) A: Vv, V3 y) 
KEE n>3:w=v, Vv, V: Vv, 
Ww'=(v Vv Vy) AO Vay Vy) ASA (Cv, V 3 co Vyja) Nets 
AN SM NV De he REN = y.) 
长 度 为 1 和 长 度 2 的 语句 的 可 满足 性 之 间 的 关系 的 证 明 以 及 转换 留 作 习 题 。 设 V 是 语句 ww =v, V 
v, V: Vv, 中 的 变量 ， 设 :是 一 个 满足 w 的 真 值 赋值 。 因 为 w 可 以 被 1 满足 ， 所 以 至 少 存在 一 个 能 被 1 
满足 的 文字 。 设 vy 是 第 一 个 这 样 的 文字 。 那 么 下 列 真 值 赋值 能 够 满足 w'。 
t(x) 如 果 xeV 
t'(x) -f WMR X=, 57° Yj-2 
0 TR x = Yj ausu 
第 一 组 j - 2 MBA RS y, yA. BA n -j +1 BAA DAS YY, Yna M Eo 
剩余 的 语句 v; V 2 yj Vy, 4 RUE vj 满足 。 
反之 , 设 t' 是 满足 w' 的 真 值 赋值 。 我 们 可 以 通过 限制 ?到 V 满足 w 来 获得 真 值 赋 值 总 证 明 的 方 
法 是 反 证 法 。 假 设 1 不 满足 w， 那 么 没有 语句 v，(1<j<n) 可 以 被 满足。 因为 w' 的 第 一 个 语句 值 为 
1, KHE r'(y,) =1。 现在， 由 于 第 三 个 语句 的 值 也 为 1， 因 此 Y(y,) =1。 使 用 同样 的 推理 ,我 们 可 以 
FIRA t'(y,) =1 对 于 所 有 满足 1<k<n -3 的 大 都 成 立 。 这 表示 w' 最 后 一 个 语句 的 值 为 0， 这 显然 是 一 
个 矛盾 ， 因 为 + 被 假设 满足 u'o j 
显然 ， 每 个 语句 到 三 元 合 取 范 式 公式 的 转换 都 是 语句 中 文字 数量 的 多 项 式 。 这 项 工作 要 求 三 元 合 
取 范 式 公 式 的 构造 是 转换 独立 语句 工作 的 总 和 。 因 此 ， 构 造 是 原 公 式 中 语句 数量 的 多 项 式 。 Ea 
NP- 完 全 问题 的 子 问 题 并 不 自动 地 就 是 NP- 完全 的 。 判 定 合 取 范式 公式 的 语句 是 否 正 好 包含 两 个 
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文字 的 二 元 可 满足 性 问题 ， 有 多 项 式 时 间 解 (练习 1) 。 因 此 二 元 可 满足 性 问题 不 是 NP- 完 全 的 除非 
PS NP 


16.3 三 元 可 满足 性 的 归 约 


以 上 我 们 给 出 的 两 个 NP- 完全 问题 都 关注 于 逻辑 公式 的 满足 情况 。 这 一 部 分 我 们 将 扩展 NP- 完 全 
问题 集合 的 范围 ， 引 入 集合 覆盖 、 图 的 路 径 、 值 得 累积 等 相关 的 问题 。 三 元 合 取 范 式 公式 的 结构 使 得 
它们 非常 适用 于 设计 其 他 领域 问题 的 归 约 = 在 本 章 的 后 续 部 分 ,我 们 将 使 用 问题 实例 的 高 层 表示 法 来 
描述 归 约 。 

我 们 要 考虑 的 第 一 个 问题 是 项 点 覆盖 问题 (vertex cover problem) 。 无 向 图 G = (N,A) 的 顶点 覆 
盖 是 一 个 N 的 子 集 VC， 使 得 对 于 A 中 的 每 条 边 [u,v] ，VC 至 少 包含 u 和 v 中 的 一 个 。 我 们 可 以 这 样 
描述 顶点 履 盖 问 题 : 给 定 无 向 图 G 和 整数 上， 是 否 存在 包含 上 个 或 少 于 大 个 顶点 的 G 的 顶点 覆盖 ? 例 
题 16. 3. 1 说 明 顶 点 覆盖 的 大 小 没有 必要 与 图 中 节点 数量 或 边 的 数量 相关 。 

例 16.3.1 AG, 的 边 被 一 个 顶点 v 覆盖 。 图 G, 的 最 小 项 点 覆盖 要 求 n/2 个 顶点 ， 每 个 顶点 履 
盖 图 中 的 一 条 边 。 














定理 16.3.1 顶点 徐 盖 问题 是 NP- 完 全 的 。 E] 
证 明 : 易 知 项 点 覆盖 问题 在 N? 中 。 非 确定 型 解 的 策略 由 选择 一 个 k 个 顶点 的 集合 和 判定 他 们 是 否 
覆盖 了 图 中 的 边 。 我 们 通过 将 顶点 覆盖 问题 归 约 到 三 元 可 满足 性 问题 来 说 明 该 问题 是 NP- 难 的 。 
H5 输 入 条 od 
三 元 可 满足 性 SWARA u u 是 可 满足 的 
到 | “HNM 
顶点 覆盖 问题 无 向 图 G = (N，A)， 整 数 上 G 有 一 个 大 小 为 大 的 顶点 覆盖 


也 就 是 说 ， 对 于 任意 三 元 合 取 范 式 公式 u， 我 们 必须 构造 一 个 图 G 使 得 G 有 一 个 大 小 为 预先 定义 的 天 
的 顶点 覆盖 ， 当 且 仅 当 x 是 可 满足 的 。 
设 
uz(u,Vu Vui): AQ Nu, o Vu,s) 

是 一 个 三 元 合 取 范式 公式 ， 其 中 每 个 (1<igm,1<j<3) 是 布尔 变量 集合 V=|x,…,x, | 上 的 文字 。 
符号 ,用 于 表示 三 元 合 取 范式 公式 中 某 个 文字 的 位 置 ; 第 一 个 下 标 表示 语句 ， 第 二 个 下 标 表 示 文 字 
在 语句 中 的 位 置 。 归 约 包括 根据 三 元 合 取 范 式 公式 构造 一 个 图 ， 其 中 妈 的 可 满足 性 与 存在 一 个 G 的 包 
含 n+2m 个 顶点 的 覆盖 是 等 价 的 。 

为 了 把 满足 真 值 赋值 的 存在 问题 转换 为 一 个 顶点 覆盖 问题 ， 我 们 必须 把 真 值 赋值 和 公式 表示 为 
图 。 我 们 引入 三 个 边 的 集合 来 从 三 元 合 取 范式 公式 构造 图 : 设 定 边 的 真 值 集合 T 为 真 值 赋 值 建 模 ， 语 
AE C, 表示 语句 uw， 链接 边 L, 连接 语句 图 和 真 值 赋 值 。 

G 的 顶点 包括 集合 : 

i) de, ayle 


ii) {u,,| 1<i<m,1<j<3}. 
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G 的 边 的 集合 是 设 定 边 的 真 值 、 语 名 边 和 链接 边 的 并 集 : 
Tsli[x;2x]|1sisnl 
C, = | [ui Mo), [a2 Ms | ta s ]} (km) 
L, = {Li vial D Vals val1l (a<k<m), 
其 中 vv 是 出 现在 公式 中 位 置 uu f x, x, | 1<i<n} CH. RIEKE T AC, 定义 的 图 的 形式 
以 及 为 了 覆盖 它们 所 需要 的 集合 的 大 小 。 
T 中 的 一 条 边 连接 一 个 正文 字 x 以 及 其 对 应 的 负 文 字 x: 


一 个 顶点 覆盖 必须 包 每 个 x,，- x, 对 的 一 个 顶点 。 为 了 覆盖 T 中 的 边 ， 最少 需要 nn 个 顶点 。 一 个 有 n 
个 顶点 的 T 的 顶点 覆盖 正好 选择 x; RIO x, 的 某 一 个 。 反 过 来 ， 这 可 以 被 看 作 是 定义 了 一 个 V 上 的 真 
值 赋值 。 

每 个 语句 us, V uj, V ws 生成 一 个 以 下 形式 的 子 图 Co FEC 连接 文字 
Us u, Fil Uj 30 一 个 覆盖 © 的 顶点 集合 至 少 包 括 两 个 顶点 。 因此 ， 集合 T 和 Cua) 


C, 的 边 的 覆盖 至 少 包含 n+2m 个 顶点 。 c f 
by PAE TARE, REMAP ARAM GL ey 
aR x, 的 位 置 。 图 16-1 给 出 了 从 公式 (x, V x Vx) AC x Vx V x). 得 
到 的 图 。 很 容易 看 出 ， 图 的 构造 多 项 式 地 依赖 于 公式 中 变量 和 语句 的 数量 。 其 余部 分 将 说 明 公式 是 
可 满足 的 ， 当 且 仅 当 相 关 的 图 由 一 个 大 小 为 n+2m 的 覆盖 。 





图 16-1 (x M x, Vx) A(^ X, Vx, Va x, ) 的 归 约 表示 图 


Hc. 我 们 说 明 一 个 大 小 为 n+2m 的 覆盖 VC 定义 了 V 上 的 一 个 满足 公式 u 的 真 值 赋值 。 通 过 前 
面 的 标记 我 们 可 以 知道 ， 每 一 个 覆盖 至 少 包 括 半 +2m 个 顶点 。 因 此 ， 正 好 是 |x,,-x| 的 一 个 顶点 和 每 
个 子 图 C, 的 两 个 顶点 在 VC 中 。 我 们 可 以 从 VC 得 到 真 值 赋值 

区 1 如 果 x,eVC 
ty a 

也 就 是 说 ,t 把 顶点 覆盖 中 那些 来 自立 ，” x 对 的 顶点 赋值 为 1。 

为 了 说 明 1 满足 每 个 语句 ， 我们 考虑 子 图 C, 的 覆盖 。u,、w;, 和 ws 中 只 有 两 个 顶点 可 以 在 VC 
Ho Bit us ITE VC P, IAW ue val 必然 被 VC 中 的 wx 覆盖 。 这 说 明 Cua) 21 且 该 语句 被 
满足 。 

现在 假设 1: V 一 10， 1] 是 一 个 满足 u 的 真 值 赋值 。 我 们 可 以 通过 真 值 赋值 构造 关联 的 图 的 顶点 
覆盖 VC. MR t(x,) =1, 那么 VC LAU x; WR t) =0, 那么 VC 包含 ~- x,, Hu, JE RT DUE 
1 满足 的 语句 j 的 文字 。 边 [wi,vii] 被 vv, 覆盖 。 添 加 CC 的 其 他 两 个 边 即 可 完成 这 个 覆盖 。 显 然 ， 
card( VC) =n+2m， 如 题 。 E 

现在 我 们 回 过 头 看 看 我 们 的 老 朋 友 哈 密 尔 顿 回路 问题 。 这 个 问题 已 经 被 证 明 是 确定 型 机 器 在 指数 


[503] 


294 pud GERM 





时 间 内 可 解 的 〈 例 15.5. 1) ， 并 且 是 非 确定 型 机 器 在 多 项 式 时 间 可 解 的 〈 例 15.5.2) 。 下 表 中 的 归 约 
说 明 哈密 尔 顿 回路 问题 是 NP- 完 全 的 。 








归 的 输 入 条 o 

三 元 可 满足 性 ”三 元 合 取 范式 公式 u & 是 可 满足 的 
到 当 且 仅 当 
哈密 尔 顿 回路 问题 有 向 图 G=(N，A) G 有 周游 


由 于 一 个 公式 的 可 满足 性 可 以 通过 检查 可 能 的 真 值 赋值 来 判定 ， 因 此 归 约 必须 将 真 值 赋值 表示 为 图 的 
形式 。 证 明 首 先 定 义 了 子 图 ， 其 中 的 周游 对 应 于 真 值 赋值 。 

定理 16.3.2 哈密 尔 顿 回路 问题 是 NP- 完 全 的 。 

证 明 : 从 三 元 可 满足 性 到 哈密 尔 顿 回路 问题 的 归 约 可 以 通过 从 三 元 合 取 范式 公式 u 构造 有 向 图 
G(w) 完 成 。 我 们 设计 这 样 的 构造 ， 使 得 G(w) 中 哈密 尔 顿 回路 的 存在 性 等 价 于 的 可 满足 性 。 设 w= 
wi Aw, A Aw, 是 一 个 三 元 合 取 范式 公式 ，V = |x ,9，…,x,| 是 二 中 出 现 的 变量 的 集合 。U 的 第 了 个 
语句 表示 为 Ww,V wsV wus， 其 中 4 是 V 上 的 文字 。 

对 于 每 一 个 变量 x, VE 7 是 x 在 u 中 出 现 次 数 和 -在 中 出 现 次 数 中 比较 大 的 值 。 如 图 16-2 
(a) 所 示 ， 为 每 个 变量 x; 构造 一 个 图 V. MA e 可 以 看 作 是 V, WAL, o; 是 出 口 。V, 中 正好 有 两 条 
开始 于 e, 结束 于 o, 并 且 正 好 访问 每 个 顶点 一 次 的 路 径 ， 如 图 16-2(b) 和 16-2(c) Mra. Me, 到 4 或 


fo 的 决定 了 V; 中 其 余 的 边 。 





e, e e, 
lio rem fo lo ————- fio ho IS fio 
AX Sia fa és i2 E fa 
fia P t De ue 
Ds d 0; x N, 





(a) (b) (c) 
16-2. 每 个 变量 x HFA 
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如 图 16-2 (d) Br, 我 们 可 以 连接 子 图 V, 来 构造 一 个 图 G'。V, 中 的 两 条 路 径 组 合生 成 2" 条 图 
G 的 哈密 尔 顿 回路 。 图 G' 的 每 一 条 哈密 尔 顿 回路 表示 了 V 上 的 一 个 真 值 赋值 。x, 的 值 是 由 开始 于 e, 
的 边 描述 的 。 一 条 从 从 e, Bt, AWA x, 的 真 值 指派 为 1。 否 则 , x, 被 赋值 为 0。 图 16-3 是 根据 下 面 的 
公式 构造 的 : 
(x Vx V^x)AGxVxVox)AG Vox Vx)A(QS x Vx, Vx) 
图 中 粗 体 边 表示 的 周游 定义 了 一 个 真 值 赋值 fO) 91. £05) 20, t(x) =0 和 (x) =1。G' 的 哈密 尔 顿 


回路 对 V 的 可 能 的 真 值 赋值 进行 编码 。 现 在 ,我 们 证 明 使 用 对 三 元 合 取 范 式 公 式 的 语句 编码 的 子 图 来 证 
明 G's 





图 16-3 ”哈密 尔 顿 回路 的 真 值 赋值 
我 们 对 每 个 语句 w 构造 一 个 图 16-4 形式 的 子 图 Ci 。 我 们 通过 按照 以 下 方法 连接 G' 的 子 图 来 构造 


图 G(z) 。 


M) — in; —> in, u) 


| | | 


mee — Ot EE ra 


图 16-4 表示 语句 w HFA 


i) MR x, 是 w 中 的 文字 ,那么 选择 以 前 没有 被 连接 到 图 C 的 i。 在 C, 中 添加 一 条 没有 连接 到 
G' 的 、 从 五 :到 顶点 i 的 边 。 然 后 添加 从 out, 到 1 的 边 。 
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ü) WR x, Je w 中 的 文字 ， 那 么 选择 以 前 没有 被 连接 到 图 C 的 to 在 C, 中 添加 一 条 没有 连接 
到 G' 的 从 到 顶点 加 的 边 。 然 后 添加 从 out, nE fa HI. 
图 16-5 是 通过 把 表示 语句 (为 Vx, V 一 为) 的 子 图 连接 成 图 16-3 的 G' 得 到 的 。 


i 
eri perd 
nt In; —9 Inz — in, 
P | ! 


Out, -— oul, -— Ou. 


图 16-5 从 C 到 G' 的 连接 


在 图 G' 中 一 条 哈密 尔 顿 回 路 表示 一 个 真 值 赋 值 。 如 果 x, 是 w 中 的 正文 字 ， 那 么 存在 一 条 从 某 个 
顶点 所 :到 C, 的 某 个 in 顶点 的 边 。 相 似 的 ， 如果- x, 是 w 中 的 负 文字 ， 那 么 存在 一 条 从 某 个 顶点 6， 
到 C, 的 某 个 in 顶点 的 边 。 当 相关 的 真 值 赋 只 能 满足 u 时， 我们 可 以 利用 这 些 边 把 G' 中 的 哈密 尔 顿 回 
路 扩展 为 G(4) 中 的 周游 。 

设 1 是 V 上 的 一 个 满足 4 的 真 值 赋值 。 我 们 将 根据 上 + 的 值 构造 一 个 穿 过 Gu) 的 哈密 尔 顿 回路 。 我 
们 首先 构造 一 个 穿 过 v 的 表示 t 的 周游 。 然 后 ， 再 绕道 看 一 下 穿 过 了 那些 为 语句 编码 的 子 图 的 路 径 。 
Vi 路 径 的 一 条 边 [4 ,fi ] 表 示 真 值 赋值 (x,) =1。 如 果 路 径 通 过 边 [4 ,fi,] 到 达 节 点 fi,， ff, 没有 连接 
到 语句 图 中 ， 并且, 包含 一 条 不 在 当前 路 径 中 的 到 子 图 C 的 边 ， 那 么 按照 以 下 方法 将 C 连接 到 周 
游 中 : 

i) 通过 Ci 中 从 所 :到 iin, 的 边 绕道 至 Ci。 

ii) 访问 C, 中 的 每 个 顶点 一 次 。 

ii) 通过 从 out, n B) t e IARAA] Vo 
绕道 到 C, 说 明 G' 中 编码 的 真 值 赋 值 满足 语句 wo 
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男 一 方面 ， 当 tz(%) 20 时 , 语句 也 可 以 被 负 文字 -x 满足。 我 们 可 以 从 顶点 t ,构造 一 个 类 似 的 
El, HF) =0, AHS ,ti] 进 入 顶点 tro 选择 一 个 没有 连接 到 任何 一 个 子 图 C, 的 顶点 ts 
按照 以 下 方式 构造 迁 回 : 

i) 通过 Ci PA tafl in ,的 边 绕 道 至 Ci。 
ii) 访问 C, 中 的 每 个 顶点 一 次 。 
iii) 通过 从 out; m Pl f... AK [REI] V,。 
由 于 每 个 语句 都 被 真 值 赋值 满足 ， 因 此 我 们 可 以 构造 一 个 访问 每 个 子 图 C, 的 G' 的 迁 回 。 通 过 这 种 方 
A, 我 们 可 以 把 一 个 满足 的 真 值 赋值 扩展 成 Gu) 中 的 周游 ， 从 而 定义 了 G' 的 哈密 尔 顿 回路 。 
现在 我 们 假设 图 Gu) 包含 哈密 尔 顿 回路 。 我 们 必须 说 明 u 是 可 以 被 满足 的 。 哈 密 尔 顿 回路 按照 
下 述 方式 定义 真 值 赋值 : 
"IIS [ 如 果 边 [e,,tioj] 在 周游 中 
i 0 如 果 边 [e,， ;o] 在 周游 中 
WMR C) =1, PARAM A Si EE. AW, WR (x) =0， 那 么 周游 包含 边 [f,， 
tinlo 

在 证 明 :满足 “前 ， 我 们 首先 检查 进入 子 图 C, 的 周游 的 几 个 属性 。 在 顶点 in, "进入 周游 时 ， 这 条 
路 径 可 能 访问 两 个 、 四 个 或 者 C 的 所 有 六 个 顶点 。 除 了 那些 在 out, "退出 的 路 径 ， 其 他 路 径 都 不 能 成 
为 一 个 周游 的 子路 径 。 假 设 在 in, ,进入 C;; 由 于 在 不 访问 某 些 顶 点 两 次 的 情况 下 ， 下 面 列 出 的 一 些 顶 
点 将 不 能 被 访问 到 ， 因 此 下 面 的 C; 中 的 路 径 不 是 一 个 周游 的 子路 径 。 











路 B 不 能 到 达 的 顶点 
njis 5, Wj3, Oul;3 Out; >, Out; , 
inji, inj5, inj 5, Out; 4, Out; > out; , 
inj, inj, Out; > out, , 
inji, inj;5, Out;,, Out; ,, Out; , inj 5 


因此 ， 惟 一 从 in, EA C, 的 周游 的 子路 径 必 须 从 out;, 退 出。 同样 的 性 质 对 顶点 in, ,和 in, 3 也 成 立 。 

周游 必须 进入 每 一 个 C,。 如 果 一 条 始 于 顶点 所 ,的 边 从 顶点 in, BEA Ci， 那么 周游 通过 从 out ,到 
teri 的 边 退 出 Cj。 图 Gu) PALS x inj, ] 的 出 现 说 明 C, 编码 的 语句 w 包含 文字 x;。 此 外 ， 当 边 [f;,， 
in, m EAC 时, Wt fin] 必须 进入 顶点 fi,。 另 一 方面 ， 顶点 4 不 在 周游 中 。 因 为 [t,,,f;,] 在 周游 
中 ， 所 以 我 们 可 以 得 到 结论 (x) =1。 因 此 ，wi 被 满足。 类 似 的 ， 如 果 边 [4,,in,, ] 进 入 C, 那么 
^ x, Æw, HH tlx) =0。 

综合 以 上 的 发 现 ， 我 们 可 以 看 到 通过 GCu) 的 哈密 尔 顿 回路 生成 的 真 值 赋值 满足 xz 的 任意 一 个 语 
句 ， 因 此 满足 u。 接 下 来 只 需 说 明 G(4) 的 构造 是 公式 u 包含 的 文字 数量 的 多 项 式 。 子 图 V, 的 顶点 和 
边 的 数量 随 着 变量 x 在 语句 4 中 出 现 的 次 数 线性 增长 。 对 于 每 个 语句 ，C, 的 构造 为 G(z) 添 加 6 个 顶 
点 和 15 条 边 。 [| 

许多 问题 都 会 将 数值 和 对 象 关联 起 来 : 开销 、 重 量 、 价 值 ， 等 等 。 我 们 在 这 一 部 分 要 考虑 的 最 后 
一 个 问题 是 ， 处 理 数值 集合 的 累计 或 评估 的 问题 可 以 是 NP- 完 全 的 。 该 问题 的 一 个 古怪 的 例子 是 由 一 
个 去 购物 狂欢 想 花 光 身上 每 一 分 钱 的 人 提出 的 。 问 题 是 : 是 否 存在 一 个 对 象 集合 使 得 它们 的 总 花费 正 
好 等 于 该 人 拥有 的 钱 的 总 数 ? 子 集 一 和 问题 (subset-sum problem) 对 上 面 的 例子 进行 了 形式 化 。 一 个 
子 集 一 和 问题 的 实例 包括 一 个 集合 S$， 一 个 值 函 数 v: SON 以 及 一 个 整数 k。 如 果 存 在 一 个 子 集 S'CS 
使 得 S' 中 所 有 元 素 值 的 和 等 于 k， 那 么 该 问题 的 答案 是 肯定 的 。 为 了 简单 起 见 ， 我 们 设 v( A) 表 示 一 个 
集合 A 中 所 有 元 素 的 值 的 总 和 。 

子 集 一 和 问题 显然 在 NP 了 内 。 一 个 非 确定 型 的 猜想 可 以 选择 S 的 一 个 子 集 。 其 余 的 计算 累计 子 集 
项 的 值 并 比较 它们 的 和 与 问题 定义 中 给 出 的 值 x。 接 下 来 我 们 只 需 说 明子 集 一 和 问题 是 NP- 难 的 。 

定理 16.3.3 子 集 一 和 问题 是 NP- 完全 的 。 

证 明 : 从 三 元 可 满足 性 问题 到 子 集 一 和 问题 的 归 约 如 下 表 所 示 。 
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H5 输 入 条 件 
三 元 可 满足 性 三 元 合 取 范式 公式 u u 是 可 满足 的 
到 l 当 且 仅 当 
子 集 一 和 问题 RAS, Krv: SON, SEX 存在 一 个 子 集 SGS Hv (S') =k 


我 们 需要 从 三 元 合 取 范式 公式 4 构造 一 个 集合 S、 一 个 S 上 的 函数 v 以 及 一 个 整数 上 ， 使 得 S 有 一 个 元 
素 和 为 大 的 子 集 ， 当 且 仅 当 是 满足 的 。 跟 前 面 的 问题 一 样 ， 我 们 设 u =w, Aw, A Aw, 是 一 个 三 元 
合 取 范式 公式 ，V = ix, x, | eu 中 出 现 的 变量 的 集合 。 


集合 S 包含 以 下 各 项 : 
1) X12. 
i-r. bed eee y 
ii) y, fel, ---, m, 
iv) Vira jmd sym. 


因此 S 有 2n+2m 个 对 象 。 我 们 必须 为 $ 中 的 每 个 对 象 赋值 。 每 个 值 都 是 一 个 n+m 位 的 整数 。 赋 值 规 
则 如 下 : 
x: PARIMA, WR x 在 语句 w 中 ， 那 么 右边 第 n+j 位 为 1， 其 他 位 是 0， 
2x; 构造 同 x,, 
yi: 右边 第 n+j 位 为 1， 其 他 位 是 0， 
TUE 同 Wio 
整数 有 n+m 位 且 每 一 位 都 是 3。 用 这 种 方式 从 三 元 合 取 范 式 公 式 u 获得 的 子 集 一 和 问题 叫做 S(u) 。 
为 了 说 明 这 种 构造 方法 的 动机 ， 我 们 在 一 个 (2n +2m) x (m+n) 表 中 考虑 那些 人 口 的 对 象 值 
的 位 。 


Wm Wi eae Xj Xi 

X, = = 0 0 3 
ST - - 0 0 3 
X) - - 0 - 3 0 
aX, - - 0 3 0 
xs = 一 3 0 0 
p. - 一 3 0 0 
» 0 1 0 0 0 
ya 0 1 0 0 0 
» 1 «es 0 0 ets 0 0 
y's 1 BY 0 0 sus 0 0 





每 个 值 的 位 置 对 应 于 表 的 n+m 列 。 最 初 2n 行 的 入 口 包 含 了 赋 给 文字 的 值 。 最 靠 右边 的 n 列 用 于 
描述 真 值 赋值 。 最 左边 的 m 列表 示 一 个 文字 是 否 在 一 个 语句 中 出 现 。 
24 x, 在 语句 w 中 出 现 且 -=x 没 有 出 现时 ， 表 中 与 文字 x; Ma x 相关 的 形式 如 下 : 





列 中 与 语句 w 关联 的 1 和 x AMAT aN, x, 在 语句 中 出 现 ， 因 此 ， 如 果 f(x) =1 那么 w 被 满足 。 
TEL x,. w 处 的 0 表示 -x 没有 在 w 中 出 现 。 
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在 证 明 前 面 的 构造 是 一 个 从 三 元 可 满足 性 问题 到 子 集 一 和 问题 的 归 约 之 前 ,我 们 先 考虑 一 下 从 三 
元 合 取 范式 公式 生成 的 三 元 可 满足 性 问题 实例 
u=w Nw, = (x VA 
相应 的 集合 SÈ [x, Sx x,,2 HAH, THIN ee’), FIRMA TRS 中 每 个 对 象 
的 赋值 。 


值 

v (x,) 2010003 
v (x) 2100003 
v (x,) 2010030 
v (~x) 2000030 
v (x,). 2100300 
v (2x,) 2010300 
v (x,) 2003000 
v (2x,) =103000 
v (y,) 2010000 
v (y’,) 2010000 
v (y,) =100000 
v (y's) =100000 


z 
~ 
= 
x 
a 
bal 
已 
AM 


xj 
x2 
x 
X4 
Ji 
y'i 
»2 
y'2 


—-—-o0o0-oo-ooc-oco 
oo-c-ooc-oo-oo- 
Oo OW SS © SS SSS 
EO Cy OX uy So OS 
Go dod o. co uw u aos 
o m OS" Oo Ore ooo dx", 





根据 我 们 对 S(u) 的 定义 , k 233333, 

ASK u 可 以 被 真 值 赋值 KKz ) 21. 105) 21. t0) 20 Al t(x,) =0 满足 。 被 真 值 赋值 满足 的 文字 
Xj.X,. 7%, 和” 加， 以 及 部 和 y,' 组 成 的 子 集 能 够 肯定 地 回答 子 集 一 和 问题 。 也 就 是 说 ， 这 些 元 素 的 
和 是 k。 这 个 例子 说 明了 集合 中 y, 和 y,' 的 角色 。 当 语句 w 能 被 它 的 一 个 或 者 两 个 文字 满足 时 ， 这 些 
对 象 可 以 被 添加 到 集合 中 ， 使 得 与 w 关联 的 列 的 和 为 3。 

表 中 的 值 说 明 ， 使 用 语句 标号 的 列 中 位 的 和 是 $， 使 用 变量 标号 的 列 中 位 的 和 是 6。 因 此， 当 给 
任何 S 的 子 集 添加 对 象 值 时 ， 列 之 间 都 不 存在 传送 和 交互 。 

首先 ， 我 们 说 明 如 果 三 元 合 取 范式 公式 u 是 可 满足 的 ， 那 么 SCu) 有 一 个 子 集 且 其 对 象 值 的 和 是 
ko Bet: V 一 10,1| 是 一 个 满足 的 真 值 赋值 。 我 们 将 从 这 个 真 值 赋值 构造 一 个 子 集 S'。 最 初 ， 对 于 每 
个 变量 x, SEE x box WME C) =1, SEA SURE x, WER x) =0, MSEE- xo HF 
每 个 x, 仅 在 集合 中 以 正文 字 或 者 负 文 字 的 形式 出 现 一 次 ， 因 此 这 些 对 象 值 的 和 的 最 右边 n 位 都 是 3。 

每 个 语句 w, 必须 被 某 些 文字 满足 。 在 与 w 关联 的 列 中 ,文字 的 值 为 1。 因 此 w, 列 中 对 应 于 真 值 
赋值 的 文字 的 位 的 和 最 少 是 1 最 多 是 3。 如果 和 是 1, 我 们 把 y My VME S' 中 。 如 果 和 是 2， 那 么 
我 们 仅 把 y,' 添 加 到 S' 中 。 在 以 上 可 能 的 y 和 y,' 添 加 以 后 ，w, 列 中 位 的 和 为 3。 

设 S(u) 是 通过 上 述 构造 得 到 的 子 集 一 和 问题 的 一 个 实例 ， 它 有 一 个 和 为 上 的 子 集 S'。 我 们 必须 
WEB] u 是 可 满足 的 。 首 先 需 要 说 明 的 是 , x, flo x, 中 的 一 个 在 S' 中 ， 而 不 是 两 个 都 在 S'。 如 果 它 们 都 
PEREP, A S' 的 对 象 值 的 和 在 右边 位 的 第 i 个 位 置 为 零 。 如 果 x, A> x, 都 在 S' 中 ， 那 么 该 位 置 
处 和 为 6。 因 此 ,文字 在 S' 中 出 现 的 次 数 定义 了 真 值 赋值 

T f WR x,es' 
| 0 否则。 
对 于 每 个 语句 w, w 列 中 S' 的 对 象 值 的 和 是 3。 这 个 总 和 可 以 包括 y, 和 y,' 的 最 大 值 。 因 此 w, 列 存在 
一 个 值 为 1 的 文字 且 该 文字 满足 语句 wo E 


16.4” 归 约 和 子 问 题 


上 面 介 绍 的 每 一 个 归 约 都 将 问题 从 一 个 领域 转换 到 另 一 个 不 相关 的 领域 ， 三 元 合 取 范式 公式 到 顶 
点 覆盖 ， 路 径 生 成 和 对 象 集合 的 值 的 分 析 。 领 域 之 间 的 归 约 要 求 具有 把 第 一 个 领域 的 问题 重新 配置 为 
等 价 的 第 二 个 领域 的 问题 的 能 力 。 这 样 的 转换 并 不 总 是 明显 的 或 者 直接 的 。 幸 运 的 是 ， 大 多 数 NP- 完 
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全 性 证 明 不 要 求 领域 的 改变 。 我 们 已 经 给 出 了 同 领域 问题 之 间 的 归 约 的 例子 一 一 可 满足 性 到 三 元 可 满 
足 性 。 这 些 问 题 的 领域 是 布尔 公式 的 满足 和 简单 的 从 公式 到 公式 的 转换 。 

说 明 一 个 问题 是 NP- 完 全 的 最 普通 的 技术 就 是 从 已 知 的 大 量 NP- 完 全 问题 中 找到 一 个 类 似 的 问 
题 。 最 重要 的 规则 是 ， 问 题 越 相似 ， 归 约 需 要 做 的 工作 就 越 少 。 证 明 问题 P 是 NP- 难 的 最 理想 的 方式 
是 ,找到 一 个 是 P 的 子 问题 的 NP- 完 全 问题 Q， 或 者 一 个 能 容易 地 转换 成 Q 问题 实例 的 P 问题 实例 。 
我 们 将 通过 对 前 面 介 绍 的 NP- 完 全 问题 的 归 约 来 说 明 这 些 策略 。 证 明 过 程 既 不 包括 设计 一 个 在 多 项 式 
时 间 内 解决 该 问题 的 非 确定 型 算法 ， 也 不 包括 归 约 可 以 在 多 项 式 时 间 内 完成 的 证 明 。 根 据 问题 的 定义 
和 归 约 的 转换 ，NP- 完 全 性 证 明 的 这 两 个 基本 元 素 是 显而易见 的 。 

下 面 是 均 分 问题 (partition problem) 。 

均 分 问题 

MA: 集合 A， 函数 v: AON 

输出 : 是 ; 如 果 存 在 一 个 A 的 子 集 A' 使 得 v(A’) =v(A -A') 

否 ; 否则 

询问 是 否 一 个 集合 的 元 素 可 以 被 分 为 两 个 不 相交 的 值 相 等 的 子 集 。 均 分 问题 和 子 集 一 和 问题 的 结 
果 都 是 由 值 等 于 预先 给 定 值 的 对 象 集合 的 存在 性 决定 的 。 我 们 可 以 利用 这 种 相似 性 来 把 子 集 一 和 问题 
归 约 到 均 分 问题 ， 从 而 说 明 它 是 NP- 完 全 的 。 

定理 16.4.1 均 分 问题 是 NP- 完 全 的 。 

证 明 : 从 子 集 一 和 问题 到 均 分 问题 的 归 约 
Uh REESE 








归 的 输 入 & 5 
EE a 

子 集 一 和 问题 WAS, Rv: SON, BHC K 存在 A 
j i AE 


= A'CAHv' (A' 
均 分 问题 RAS, Bv: AN em Hv (A) 
=v’ (A- A!) 


—————— Á—— Á aicut cities Ara 
要 求 构造 一 个 子 集 一 和 问题 的 实例 的 集合 A、 一 个 元 素 S 和 v 上 的 值 函数 v' 以 及 k。 集 合 A 和 值 函数 
Vv" 可 以 如 下 定义 : 

A=SU|y,z| 

v'(x) 2Qv(ix) «eS 

v'(y) 23t -2k 

v'(z) =t+2k, 
其 中 ,t=v(S) 是 集合 S 中 所 有 元 素 的 值 的 和 。v(x) 乘 以 2 的 原因 是 要 保证 集合 A 的 值 的 总 和 是 偶数 ， 
只 有 这 样 划分 才 是 可 能 的 。 使 用 函数 v' 可 知 ， 集 合 S 中 所 有 元 素 的 值 的 总 和 是 2+ (3t - 2k) + (t+2k) 
=6t。 

首先 要 说 明 的 是 , 我们 可 以 根据 子 集 一 和 问题 的 解 为 均 分 问题 构造 一 个 解 。 由 于 S' 是 一 个 解 ， 我 
们 知道 
VCS RS * v(x) =k 


xeS' 


v'(A') = py v'(a) 


aed’ 


=v'(y) + » v'(x) 


=3t -2k «2k 
Rt; 
它 是 A 的 值 的 总 和 的 一 半 。 因 此 ，A' 是 均 分 问题 的 解 。 


我 们 定义 A' 是 集合 S'U ly}, WE: 
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现在 假设 A 和 v 可 以 从 S、v 和 上 的 归 约 获得 ，A AD SE X ALY, Hv (X) =v (Y) =3t。 R 
们 必须 说 明 存 在 一 个 子 集 S'， 其 元 素 的 值 的 总 和 是 ko 

由 于 v'(y) +v'(z) =4t 大 于 A 的 值 的 总 和 的 一 半 ， 因 此 元 素 y 和 z 不 可 能 属于 A 的 划分 的 同一 个 
集合 。 假 设 y 在 其 中 的 一 个 集合 AP, MA 

y (X - lyl) zv'CX) -v'Cy) 
-31 - (31 - 2k) 
z2k. 

"nf X- 1y| 是 S 的 一 个 子 集 , 且 它 的 值 v(X- |y} ) =k. Kie X- 1y| 是 子 集 一 和 问题 的 一 个 解 。 M 

我 们 来 考虑 一 下 学 校 校 规 的 困境 ， 它 希望 成 立 一 个 包括 学 校 中 每 一 个 俱乐部 代表 的 理事 会 。 事 实 
是 一 共有 15 个 俱乐部 并 上 且 一 个 学 生 可 以 是 任意 一 个 俱乐部 的 成 员 。 校 规 要 求 理 事 会 有 10 个 成 员 。 是 
否 可 以 成 立 一 个 满足 要 求 的 理事 会 呢 ? 这 个 问题 是 碰 集 问题 (hitting set problem) 的 一 个 例子 。 形 式 
化 地 说 ， 一 个 碰 集 问题 的 实例 包括 一 个 集合 S， 一 个 S 的 子 集 的 有 限 族 (collection) € 21C,,--, 
C,}| ， 以 及 一 个 整数 k。 如 果 对 于 每 个 C; BA CNC, +O, MABACHECHME. HRB, BME 
合 C, 都 被 C 的 元 素 击 中 。 如 果 存 在 一 个 大 小 等 于 或 小 于 大 的 碰 集 ， 那 么 该 问题 的 答案 是 肯定 的 。 

我 们 也 可 以 不 考虑 C 的 元 素 击 中 C,, ， 而 是 考虑 元 素 覆 盖 C;。 这 种 解释 揭示 了 顶点 覆盖 问题 和 碰 
集 问 题 的 相似 性 。 我 们 会 把 顶点 覆盖 问题 归 约 到 磁 集 问题 ， 从 而 说 明 碰 集 问题 是 NP- 完 全 的 。 

定理 16.4.2 碰 集 问题 是 NP- 完 全 的 。 

证 明 : 我 们 可 以 按照 下 述 方式 ， 从 顶点 覆盖 问题 的 一 个 实例 G = (N,A) ,k 得 到 磁 集 问题 的 一 个 实 
Bl, 的 元 素 是 G 的 节点 。 每 条 边 [n,n ] 定 义 了 一 个 包含 两 个 元 素 的 集合 |n;,n,|。 类 CC 包括 所 有 从 G 
的 边 得 到 集合 。 最 后 , 大 在 这 两 个 问题 中 是 相同 的 。 现 在 我 们 来 说 明 ，G 有 一 个 大 小 为 的 项 点 覆盖 ， 
当 且 仅 当 ， 存 在 一 个 规模 小 于 等 于 上 且 与 类 CE 相关 的 碰 集 。 

假设 存在 一 个 大 小 为 天 的 顶点 覆盖 VC。 该 集合 是 一 个 适当 大 小 的 C 的 碰 集 。 反 之 , 假设 C 有 一 
个 小 于 等 于 上 的 碰 集 C。 则 每 一 个 集合 |n; ,nj| e C 都 被 C 的 元 素 击 中 。 在 图 G 的 表示 中 ， 就 是 每 条 边 
[n,n,] 都 被 C 中 的 一 个 顶点 覆盖 。 因 此 C 是 不 大 于 上 的 顶点 覆盖 。 m" 

通过 把 边 解 释 成 包含 两 个 元 素 的 集合 和 把 覆盖 解释 成 击 中 ， 项 点 覆盖 问题 就 变 成 了 碰 集 问题 的 子 
问题 。 把 一 个 已 知 的 NP- 完 全 问题 解释 成 一 个 待定 问题 的 子 问题 的 能 力 通常 可 以 使 得 NP- 完 全 性 的 证 
明显 得 几乎 微不足道 。 装 箱 问 题 (bin-packing problem) 是 这 种 情况 的 另外 一 个 例子 。 我 们 将 说 明 均 
分 问题 可 以 简单 地 转换 成 装 箱 问题 的 子 问 题 。 

装 箱 问 题 

输入 : EAA, WKK Ss: AON, ERB kA m 

输出 : 是 ; 如 果 存 在 一 个 A 的 划分 Al,A: ,…Ak 使 得 SCA.) <m(1 <i<k) 

否 ; 否则 
定理 16.4.3 装 箱 问题 是 NP- 完全 的 。 
WEBB: 归 约 形式 如 下 : 





H 5 W 入 条 件 
二 "c ' ' 
均 分 问 是 RAA, Hi Y: AGN me MEA 
=v’ (A- A") 
到 l 当 且 仅 当 
; 存在 一 个 划分 Al Ar, Ar WRF 
装 箱 问 题 GA, HU Sv, BAK Am 


所 有 i 都 有 s (A) <m 


正如 归 约 的 描述 所 示 ， 两 个 问题 使 用 同样 的 集合 和 函数 。 简 下 的 问题 是 要 为 装 箱 问题 选择 整数 和 m。 
由 于 均 分 问题 试图 把 A 分 成 两 个 值 相等 的 集合 ， 我 们 设 上 =2。 最 后 设置 m 等 于 A 中 元 素 值 的 和 的 一 
Æ, Bl m=s(A)/2, RATER. 
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这 个 归 约 将 均 分 问题 看 作 是 有 两 个 容量 最 大 为 sCA) /2 箱子 的 装 箱 问题 。 如 果 一 个 集合 A'CA T 
足 均 分 问题 ,那么 A' 和 A -A' 构 成 了 一 个 满足 装 箱 问题 的 划分 。 反 之 ， 装 箱 问 题 的 一 个 容量 边界 为 
5( 人 A)/2 的 解 A, 和 A, 也 是 均 分 问题 的 解 。 Lij 


16.5 最 优化 问题 


有 许多 问题 的 目标 不 仅仅 是 判定 是 否 存在 一 个 解 ， 而 是 找到 一 个 最 理想 的 解 。 一 个 最 理想 的 解 可 
以 最 小 化 代价 ， 最 大 化 值 ， 最 高 效 地 利用 资源 等 等 。 由 于 其 结果 不 再 是 一 个 是 或 否 的 回答 ， 因 此 最 优 
化 问题 不 符合 我 们 对 判定 问题 的 定义 。 然 而 ， 我 们 为 判定 问题 考虑 的 时 间 复 杂 性 问题 在 最 优化 问题 中 
同样 存在 。 

我 们 使 用 货 郎 担 问题 (traveling salesman problem) 来 说 明证 明 最 优化 问题 NP- 完 全 性 所 使 用 的 策 
略 。 货 郎 担 问题 是 哈密 尔 顿 回路 问题 的 一 般 化 ， 它 试图 在 带 权 有 向 图 中 找到 一 个 代价 最 小 的 周游 ， 其 
中 一 个 路 径 的 代价 就 是 路 径 上 边 的 权 的 总 和 。 这 个 问题 描述 了 这 样 一 种 情况 ， 一 个 货 郎 希望 他 路 途上 
的 每 一 村 庄 正 好 一 次 ， 并 且 走 最 短 的 路 程 。 

通过 为 问题 实例 添加 一 个 距离 边界 ,我们 可 以 把 货 郎 担 问题 可 以 转换 为 判定 问题 : 

货 郎 担 问题 

MA: 带 权 有 向 图 GS (N,A,w) , EC 

输出 : 是 ; 如 果 G 有 一 个 代价 小 于 等 于 大 的 周游 

否 ; 否则 
给 代价 增加 一 个 边界 把 期 望 路 径 的 答案 变 成 了 是 或 否 响应 。 

我 们 可 以 迭代 地 使 用 判定 问题 的 解 来 生成 一 个 原 问 题 的 解 。 设 n 是 G 的 节点 数量 ，! 是 代价 最 小 
的 nn 条 边 的 代价 总 和 ，u 是 代价 最 大 的 nn 条 边 的 代价 总 和 。 任 何 一 个 G 的 周游 的 代价 都 在 1 和 之 间 。 
我 们 可 以 迭代 地 对 下 面 一 系列 判定 问题 求解 直到 得 到 一 个 肯定 答案 或 者 问题 实例 返回 否定 响应 ， 这 样 
便 能 获得 代价 最 小 的 周游 的 代价 。 在 后 一 种 情况 下 ， 图 中 不 存在 周游 。 

G = (NA, w) k=l 
G=(N,A,w),k=l+1 
G=(N,A,w) ,k=1+2 


G=(N,A,w) ,k=u 

EH 16.5.1 货 郎 担 问题 是 NP- 完 全 的 。 

WEBB: 哈密 尔 顿 回路 问题 可 以 看 作 是 货 郎 担 问 题 的 子 问题 。 设 G = (N,A) 是 哈密 尔 顿 回路 问题 的 
实例 。 为 了 获得 货 郎 担 问 题 的 实例 ， 我 们 仅仅 需要 为 G 定义 一 个 权重 函数 w 和 边界 k。 设 w 给 每 一 条 
边 赋 值 1， 设 上 是 G 的 节点 数量 。 图 G 有 一 个 周游 ， 当 且 仅 当 ， ANDA E 
TEENA 

背包 问题 (knapsack problem) 是 一 个 经 典 的 最 优化 问题 ， 它 关心 的 是 在 一 定 的 大 小 限制 下 ， 
择 一 个 值 最 大 的 对 象 集合 。 对 这 个 问题 的 最 有 趣 的 描述 讲述 了 这 样 种 情况 ， 一 个 小 偷 必须 决定 把 哪些 
东西 放 进 他 的 背包 里 。 他 的 目标 是 对 象 的 值 最 大 ， 但 是 他 的 选择 受制 于 背包 的 大 小 。 背 包间 题 的 判定 
问题 版 本 是 : 

背包 问题 

MA: 集合 S$， 规模 函数 s: S 一 N， 值 函数 ": SON, BME m, KAR b 

输出 : 是 ;如果 存在 一 个 子 集 S'GS 使 得 %(S') <b H v(S') Sm, 

否 ; 否则 
定理 16.5.2 背包 问题 是 NP- 完全 的 。 
WEBB: 归 约 形式 如 下 : 
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H5 WX 条 件 
zs / r 
均 分 问 是 RAA, Riv: AN PETEN SA BAN 
=v’ (A- A!) 
到 | "CN 
e EGA, ll s mv, v, 存在 一 个 子 集 A' 使 得 s (A) <b H 
indus HH b Hl m v.(À') 2m 


这 个 归 约 在 跟 均 分 问题 相同 的 领域 内 创建 了 一 个 背包 问题 。 背 包 问 题 的 规模 函数 和 值 函 数 都 用 于 设置 
均 分 问题 的 规模 函数 。 把 b 和 m 定义 为 s(A)/2 归 约 即 可 完成 。 由 于 背包 问题 的 规模 函数 和 值 函 数 与 
均 分 问题 的 规模 函数 相同 ， 因 此 一 个 集合 A' 满 足 均 分 问题 的 要 求 ， 当 且 仅 当 它 也 满足 相应 的 背包 问题 
的 要 求 。 m 


16.6 近似 算法 


N 了 类 的 重要 性 不 仅仅 是 理论 上 的 ， 而 是 实际 的 。NP- 完 全 问题 非常 自然 地 出 现在 很 多 领域 ， 包 
括 模式 识别 、 调 度 、 决 策 分 析 、 组 合 数学 、 网 络 设计 和 图 论 等 。 判 定 一 个 问题 是 NP- 完 全 的 并 不 意味 
着 不 再 需要 解 ， 而 是 非常 不 可 能 找到 能 解决 这 些 问题 的 多 项 式 时 间 算 法 。 

我 们 通过 货 妇 的 考虑 来 考察 处 理 NP- 完 全 问题 的 过 程 ， 货 郎 希望 他 决定 路 线 的 过 程 能 够 自动 化 。 
我 们 把 城市 和 道路 表示 成 有 向 带 权 图 G = (N,A,w) 的 节点 和 边 ， 权 重 函 数 w(x,y) 给 出 了 从 城市 x 到 
城市 y 的 道路 的 距离 。 货 郎 必 须 访 问 的 城市 是 可 以 变化 的 ， 此 时 他 必须 计算 一 个 新 路 线 。 当 铀 8 他 的 
目标 是 访问 每 个 城市 一 次 然后 回 家 ， 并 且 在 旅途 中 花费 尽 可 能 少 的 时 间 。 已 知 货 郎 担 问题 是 NP- 完 全 
的 ， 货 郎 应 该 怎样 解决 设计 路 线 的 问题 ? 

第 一 步 是 要 判定 问题 的 NP- 完全 性 是 否 与 他 特定 的 情况 相关 。 如 果 路 线 仅 包含 几 个 城市 ， 那 么 解 
决 这 个 问题 的 算法 的 渐进 性 能 是 无 关 紧要 的 。 构 成 一 个 小 问题 实例 的 节点 数量 取决 于 可 用 的 计算 资源 
和 算法 应 用 的 频率 。 

如 果 算 法 经 常 被 使 用 ， 即 使 是 对 一 个 相对 小 的 节点 数量 ,那么 它 也 值得 我 们 使 用 算法 理论 的 技术 
来 优化 查找 技术 。 例 15. 5. 1 的 图 灵机 用 来 解决 哈密 尔 顿 回路 问题 的 穷尽 测试 所 有 节点 序列 的 策略 需 
要 检查 nw" 条 可 能 路 径 ， 其 中 是 城市 的 数量 。 分 支 定 界 法 (branch-and-bound algorithm) 可 以 用 于 裁 
前 搜索 数 并 减少 需要 考虑 的 路 径 的 数量 。 一 个 动态 程序 算法 可 以 在 O(n2" ) 时 间 生 成 最 小 距离 周游 。 尽 
管 仍然 是 指数 级 的 ， 与 穷尽 搜索 策略 相 比 这 已 经 是 一 个 相当 可 观 的 缩减 了 。 

如 果 需 要 的 话 ， 货 郎 下 一 步 需 要 考虑 把 问题 重新 公式 化 为 男 一 个 可 以 在 多 项 式 时 间 解 决 的 问题 。 
新 问题 的 解 可 能 不 是 最 理想 的 周游 ， 但 是 对 于 他 的 目的 而 言 这 些 解 是 可 以 接收 的 。 按 照 这 种 方法 ， 货 
郎 在 地 图 上 标记 他 必须 访问 的 所 有 城市 并 决定 设 一 个 路 线 ， 这 个 路 线 从 最 东边 的 城市 开始 然后 单独 从 
东 到 西 地 走 到 最 西边 的 城市 。 当 他 按照 严格 的 从 西 到 东 路 线 返 回 到 原 城市 时 ， 周 游 结 束 。 

从 东 到 西 策略 的 动机 是 两 个 城市 之 间 的 最 短路 线 不 应 该 包括 偏离 目标 的 分 支 。 这 个 方法 经 常 产生 
不 错 的 近似 解 ， 然 后 ， 图 16-6 给 出 了 一 个 最 理想 的 距离 为 82 的 周游 ， 而 双向 的 解 的 距离 是 140。 我 
们 可 以 增加 更 多 从 a, 到 ai B “Z 字 路 线 ” 来 继续 图 中 从 节点 a 到 az 的 构成 模式 。 这 不 会 增加 最 小 
代价 的 周游 ， 但 是 最 小 代价 的 双方 向 的 周游 可 以 被 增加 到 任意 大 。 





;图 16-6 “双方 向 货 郎 担 问题 的 解 
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认识 到 他 的 双方 向 策略 可 能 产生 过 长 的 周游 后 ， 货 郎 问 了 以 下 两 个 问题 

1. 是 否 存在 一 个 解决 双方 向 问题 的 ， 又 不 会 导致 周游 比 最 理想 周游 任意 大 的 多 项 式 时 间 算 法 ? 

2. 如果 上 面 问题 的 答案 是 否定 的 ， 那 么 为 了 获得 一 个 多 项 式 时 间 的 近似 解 还 需要 添加 哪些 条 件 ? 

我 们 将 会 在 介绍 了 近似 算法 性 能 度量 后 再 回答 这 些 问 题 。 

最 优化 问题 的 解 包括 一 个 我 们 一 般 用 作 解 的 代价 的 参考 的 数值 。 例 如 ， 货 郎 担 问题 实例 的 解 包括 
一 个 周游 以 及 作为 其 代价 的 总 距离 。 背 包 问 题 的 解 包 括 一 个 对 象 集合 ， 其 相关 代价 是 集合 内 对 象 的 值 
的 和 。 近 似 算法 可 以 生成 代价 可 能 不 是 最 理想 的 解 。 近 似 算法 的 错误 是 最 理想 解 的 代价 和 近似 解 的 代 
价 之 前 的 差别 。 

设 c(p;) 和 c* (pi) 分 别 表示 最 优化 问题 P 的 实例 p, 的 近似 算法 产生 的 解 的 代价 和 最 优 解 的 代价 。 
近似 算法 的 质量 是 通过 近似 解 的 代价 和 最 优 解 的 代价 的 对 比 来 度量 的 。 

定义 16.6.1 一 个 对 最 优化 问题 P 产生 近似 解 的 算法 叫做 Qa- 近似 算 法 ( a-approximation algo- 
rithm), 40% 

i) MARRIM c(p,)<a+c* (p) ,或 者 

ii) XD ACID Cc (p) €a * c(p,) 
对 于 所 有 的 a 二 1 和 所 有 PP HXH p, 都 成 立 。 

一 个 最 小 化 问题 的 2 -近似 算法 产生 的 解 的 代价 至 多 是 最 优 解 的 代价 的 两 倍 。 对 于 一 个 最 大 化 问 
题 ，2 - 近似 算法 产生 的 解 的 代价 至 少 是 最 优 解 的 代价 的 一 半 。 

我 们 可 以 这 样 重新 闻 述 货 郎 问题 ;“ 货 郎 担 问题 是 否 存在 一 个 多 项 式 时 间 ga- 近似 算法 ”和 “为 了 
得 到 一 个 多 项 式 时 间 的 a- 近 似 算法 ,问题 要 做 哪些 必要 的 变化 ?”。 第 一 个 问题 的 答案 是 否定 的 ， 除 


ARP = NT 了。 第 二 个 问题 的 一 个 答案 是 ， 如 果 图 是 全 连通 的 并 且 距 离 满足 三 角 不 等 式 ， 那 么 我 们 可 以 


得 到 一 个 2 -近似 算法 。 RI 

定理 16.6.2. 如 果 了 关 JNP ， 那 么 货 郎 担 问题 不 存在 多 项 式 时 间 a- 近 似 算 法 。 

证 明 : 我 们 将 证 明 货 郎 担 问题 的 多 项 式 时 间 a- 近 似 算法 可 以 用 于 在 多 项 式 时 间 内 解决 哈密 尔 顿 
回路 问题 。 因 为 如 果 叶 承 NP ,那么 后 者 是 不 可 能 做 到 的 。 因 此 可 知 在 同样 的 假设 下 不 存在 这 样 的 
算法 。 

我 们 首先 定义 哈密 尔 顿 回路 问题 实例 到 货 郎 担 问题 实例 的 转换 。 设 G= (N,A) 是 哈密 尔 顿 回路 问 
题 的 实例 且 = card(N) s。 相应 的 货 郎 担 问题 是 全 连通 图 G' = (N,A',w) ， 其 中 w 的 定义 如 下 : 

en yf 如 果 [x,y] eA 
j a*ns1l Ml 
显然 ， 根 据 G 构造 G' 的 过 程 可 以 在 G 的 表示 长 度 的 多 项 式 时 间 内 完成 。 

如 果 G 是 一 个 周游 ， 那 么 相应 的 G' 中 的 周游 代价 为 x。 如 果 G 不 包含 周游 ， 那 么 G' 中 的 每 一 个 
周游 的 代价 都 大 于 a* n， 这 是 因为 它 至 少 包含 一 条 不 在 A 中 的 边 。 在 前 一 种 情况 下 ， 由 于 所 有 其 他 
周游 都 超出 了 近似 值 边界 ， 因 此 ， 在 G' 上 运行 一 个 a- 近 似 算法 必然 产生 一 个 代价 为 n 的 周游 。 因 此 ， 
G 包含 一 个 周游 ， 当 且 仅 当 a- 近 似 算 法 返回 一 个 代价 为 n 的 周游 。 

上 述 的 相等 描述 了 一 个 哈密 尔 顿 回路 问题 的 解 : 从 G 构造 G' 并 且 使 用 近似 算法 获得 了 一 个 G' 的 
周游 。 根 据 以 上 观察 ， 近 似 算法 返回 的 周游 的 长 度 为 x， 当 且 仅 当 G 包含 周游 。 如 果 a- 近 似 算法 在 多 
项 式 时 间 内 是 可 计算 的 ， 那么 相应 的 哈密 尔 顿 回 路 问题 的 解 在 多 项 式 时间 内 也 是 可 计算 的 。 m 

当 图 G = (N,A,w) 是 全 连通 的 ， 并 且 其 上 距离 函数 是 可 交换 的 且 满 足 三 角 不 等 式 ， 那 么 我 们 可 以 很 
容易 地 为 货 郎 担 问题 生成 一 个 2 - 近似 算法 。 也 就 是 说 ， 

w(x,y) -w(y,x) H., 

w(x,y) €w(x,z) +w(z,y) 
对 于 所 有 x,y,zsN 都 成 立 。 有 时 候 , 带 有 附加 条 件 的 货 郎 担 问题 被 叫做 欧 几 里 得 货 郎 担 问题 (euclidean 
traveling salesman problem) 。 

近似 算法 首先 构造 一 个 G 的 最 小 代价 生成 树 。 一 个 无 向 连通 图 的 生成 树 是 一 个 包含 了 图 中 所 有 节 
点 的 连通 的 非 循 环 的 子 图 。 生 成 树 的 代价 是 树 中 所 有 边 的 权 的 和 。 如果 一 个 带 权 有 向 图 G 是 全 连通 的 
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且 其 距离 函数 是 可 交换 的 ， 那 么 这 个 图 可 以 被 看 作 是 无 向 图 。 对 于 每 条 边 [x,y] ， 存 在 一 条 同样 权重 
的 边 [y, x]. 

把 图 G 解释 成 无 向 图 后 ,我 们 可 以 用 Prim 算法 在 时 间 O(n”) 内 生成 一 个 最 小 生成 树 ， 其 中 是 
G 的 节点 数量 。 下 面 这 个 包含 四 个 步骤 的 过 程 定义 了 一 个 欧 几 里 得 货 郎 担 问 题 的 2 - 近似 算法 。 

1. 选择 一 个 节点 xeN 作为 生成 树 的 根 节点 。 

2. 建立 G 的 最 小 代价 生成 树 。 

3. 构造 生成 树 的 前 序 遍 历 所 访问 的 节点 序列 。 

4. 删除 在 序列 中 出 现 多 于 一 次 的 节点 。 

图 16-7 给 出 了 从 生成 树 获 取 周 游 的 过 程 。 一 个 前 序 遍 历 从 根 节 点 c 开始， 访问 所 有 节点 (许多 节 
点 多 次 被 访问 ) ， 在 “ 处 结束 。 为 了 从 遍历 生成 的 路 径 中 获取 周游 ， 我 们 顺序 地 删除 对 同一 个 节点 的 
多 次 访问 。 在 图 16-7 的 序列 中 ,节点 c 在 a 后 和 4d 前 被 重复 访问 ， 并且 三 角 不 等 式 保证 了 备用 路 径 不 
比 原 有 路 径 长 。 


节点 访问 序列 :ca,c,d,e,df'd.c,g,h,g,c,b,c 
周游 :c,a,de,f'g,h,b,c 





图 16-7 生成 树 获 取 周 游 


除了 根 节点 在 路 径 开始 和 结束 处 的 出 现 ， 我 们 可 以 重复 这 个 过 程 来 剔除 所 有 节点 的 多 次 出 现 。 结 
。， 果 路 径 是 一 个 周游 。 为 了 分 析 周 游 的 代价 ， 我 们 设 t* Sm”. p 和 上 分 别 代表 最 小 代价 周游 、 最 小 代价 
生成 树 、 前 序 遍 历 生成 的 路 径 和 使 用 节点 剔除 策略 得 到 的 周游 。 
我 们 可 以 通过 删除 图 的 最 小 代价 周游 的 任何 独立 的 边 来 得 到 一 个 生成 树 。 结 果 生 成 树 的 代价 是 最 
小 代价 生成 树 M 的 代价 的 边界 。 因 此 ， 
m st 
生成 树 的 每 一 条 边 在 前 序 遍 历 生成 的 路 径 都 出 现 两 次 ， 所 以 
p-2m'. 
由 于 节点 删除 过 程 不 会 增加 结果 路 径 的 代价 ， 因 此 算法 产生 的 周游 的 代价 以 前 序 路 径 的 代价 为 边 
界 。 综 合 不 等 式 
ipt , 
生成 了 通过 这 种 方式 构造 的 周游 的 2 -近似 边界 。 
本 节 我 们 列 出 了 当 遇 到 NP- 完 全 问题 时 构造 解 的 策略 。 这 位 虚构 的 货 郎 使 用 的 步骤 是 : 
a) 判定 渐 近 复杂 性 是 否 与 问题 相关 ， 
b) 把 问题 重新 形式 化 为 一 个 高 效 地 可 解 问题 ， 或 者 
c) 开发 一 种 能 生成 近似 解 的 算法 。 
这 些 步骤 为 我 们 获取 NP- 完 全 最 优化 问题 的 合适 的 解 提 供 了 很 好 的 开端 。 


16.7 近似 方案 


— 7 UB BI yr NP- 完 全 问题 的 系统 应 该 允许 用 户 描 述 在 特定 应 用 中 所 允许 的 错误 的 程度 。 对 那 
些 高 精度 尤其 重要 的 问题 ,我 们 可 以 选择 一 个 错误 边界 来 帮助 达到 必要 的 精度 。 对 于 那些 不 要 求 高 精 
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确 度 的 问题 ， 我 们 可 以 使 用 更 加 有 效 的 方式 来 生成 不 是 那么 精确 的 近似 解 。 对 于 一 些 NP- 完 全 问题 ， 
这 个 理想 是 可 以 实现 的 。 

一 个 近似 方案 (approximation scheme) 是 指 这 样 一 个 算法 ， 其 输入 参数 用 于 描述 可 接受 的 错误 边 
界 。 最 小 化 问题 的 一 个 参数 为 k 的 近似 方案 生成 的 解 对 于 所 有 问题 实例 p; 满足 


P ket 
c' (p) <c(p,) € : 





E e^ (P) 
最 大 化 问题 的 边界 是 
Fie sep) «c (p,): 


在 其 他 情况 下 ,k 的 值得 增加 会 提高 近似 的 精确 度 。 一 个 多 项 式 时 间 近 似 方案 是 这 样 一 个 近似 方案 ,对 
于 所 有 变量 而 言 ,其 时 间 复 杂 性 是 参数 上 的 多 项 式 。 

我 们 将 使 用 背包 问题 来 说 明 近似 方案 的 属性 。 背 包 问 题 的 最 简单 的 近似 方案 是 ， 最 初 在 背包 中 放 
置 一 些 项 ， 然 后 使 用 贪心 算法 完成 选择 。 背 包 问 题 最 优化 版 本 的 一 个 实例 包括 一 个 集合 S = {a,,…， 
ai| ， 规 模 函 数 *: S 一 N， 值 函数 ": SON 和 大 小 边界 bo 我 们 分 别 使 用 c* 和 c 表示 背包 问题 的 最 优 
解 和 近似 解 的 值 。 

背包 问题 的 贪心 算法 会 选择 一 个 适合 于 背包 的 相对 值 v(a,)/s(a,) 最 高 的 项 a,。 这 个 过 程 会 一 直 
重复 到 剩余 的 项 都 不 能 放 进 背包 中 。 不 幸 地 是 ， 使 用 这 种 方法 不 能 产生 错误 边界 〈 练 习 14) 。 

参数 为 大 的 近似 方案 按照 下 述 方式 选择 一 个 集合 : 

l. 生成 所 有 势 小 于 等 于 不 的 子 集 下 ES。 

2. 对 于 每 个 大 小 满足 8 (L) <b 的 子 集 ,根据 初始 值 ， 规 模 函 数 和 边界 b-s (1), ERSS- I, 
S 心算 法 生成 集合 Go GHEAL MG, TGs 

3. 集合 T 有 最 大 值 。 
包含 元 素 个 数 小 于 等 于 大 的 子 集 的 生成 以 及 判定 它们 是 否 满足 边界 条 件 的 测试 过 程 能 够 产生 一 系列 初 
始 集 合 I。 可 以 通过 使 用 贪心 算法 生成 集合 Gi 来 完成 初始 集合 。 初 始 集合 的 总 集合 T, ELLUG., 我 
们 需要 说 明 的 是 ， 对 于 每 个 问题 实例 和 所 有 kl, 算法 都 能 生 一 个 满足 下 面条 件 的 近似 解 。 
k 
k+1 
假设 集合 T 给 出 的 最 优 解 有 jj 个 元 素 。 我 们 考虑 两 种 情况 jk 和 j >。 

情况 1: j<k。 集合 T 是 第 一 步 生 成 的 某 个 初始 集合 ， 最 优 解 通过 算法 产生 。 

情况 2: j>k。 最 优 解 了 可 以 划分 成 两 个 集合 1= 12,,, 4, HIR 21a,,,-,a)], RrPEGIET 
的 个 值 最 大 的 项 ，R 包含 剩余 的 项 ， 这 些 项 按照 其 相对 值 排序 ; 

v( a )/s( dii )zv( d) SN 852) ze a,)/s( à,). 
首先 我 们 需要 注意 的 是 ， 对 于 每 个 4, sR 都 有 ” (4) «c'/ (k*1). ET AMET, a, eL, 都 
fi v) zk-v(a,). A 
c* =v(T) =v(I) *v(R) zk * v(a,) *v(à,) >(k+1)v(a,) 





"chus 


成 立 。 

考虑 使 用 贪心 算法 从 集合 I 生成 的 近似 解 。 如 果 贪心 算法 选择 了 所 有 在 最 优 解 R 中 的 项 ， 那 么 算 
法 生成 一 个 最 优 解 。 

否则 ， 设 G 是 贪心 算法 生成 的 1 的 扩展 ，a,, 是 R 中 没有 被 贪心 算法 选中 的 第 一 个 项 。 只 有 在 考 
Ha, 时 背包 只 剩 下 一 个 不 充分 的 空间 ， 这 种 情况 才 会 发 生 。 集 合 包括 了 了 H s Âu âna, 
其 他 项 的 相对 值 大 于 4,,。 现 在 ,我 们 用 G, 来 生成 集合 R 的 值 的 上 界 。G,, 中 的 元 素 的 比值 大 于 R 中 
那些 大 小 总 和 为 s( G,,) 的 初始 项 。 这 是 因为 G, 包含 了 R 中 所 有 比值 大 于 v( 3, )/s( 人) 的 对 象 。G， 
中 所 有 其 他 对 象 的 相对 值 都 小 于 (an )/s( 4,)。 注 意 ，R 中 项 的 大 小 不 需要 正好 累计 到 5CG, ) 。 我 们 
可 以 考虑 分 割 一 个 项 来 获得 大 小 为 s(G;) 的 R 的 子 集 。 

可 以 添加 到 G, 的 可 能 的 最 大 值 最 多 填 满 背包 vC, ) 的 空间 ,因为 剩 下 的 空间 小 于 sân), HER 
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心算 法 在 按照 相对 值 顺 序 搜索 时 已 经 通过 了 a,,。 由 于 R 中 的 项 4 ,… ,4 的 相对 值 最 大 是 v6,,)/s(&,)，; 
所 以 这 也 是 填补 背包 剩余 空间 的 值 的 上 界 。 通 过 上 面 的 观察 ， 我 们 可 以 看 到 


c* =v(1) *&v(R) «v(I) *v(G,) +v(a)<v(D +v(G) t v(à, ). 


使 用 不 等 式 v( 4) &c' / Ck 1) ,我 们 可 以 得 到 


c^ <v(1) +v(G) +v(a,,) <c#c*°/(k +1) 


或 者 


Kk 
k+l 


我 们 还 需要 说 明 针 对 每 一 个 大 1 生成 的 近似 算法 是 背包 问题 实例 的 大 小 的 多 项 式 。 设 C(n,i) 是 


«esse 


TAEA i H n PER 势 小 于 等 于 k 且 包含 个 对 象 的 子 集 的 数量 是 


Y cn. sonas 1): Tm i+1) 
<1+ y on 


1 + n 
名 
=1 +k. n. 


使 用 贪心 算法 扩展 所 有 这 些 需 要 的 时 间 为 O(n) 。 因 此 时 间 复 杂 性 是 O(k: n), 


.尽管 上 述 近 似 算 法 是 每 个 k 的 多 项 式 , 但 是 时 间 复 杂 性 却 随 着 参数 做 指数 级 的 增长 。 因 此 ， 错 


误 的 降低 伴随 着 生成 近似 解 所 需 时 间 的 指数 级 增长 。 一 个 是 n 和 的 多 项 式 的 近似 方案 叫做 完全 多 项 
式 。 结 合 贪 心算 法 和 动态 程序 可 以 降低 时 间 复 杂 性 ， 从 而 可 以 为 背包 问题 生成 一 个 的 OC - 天 ) 完 全 
多 项 式 近似 方案 。 


16.8 练习 


a 


如 果 一 个 公式 是 合 取 公式 ， 且 它 的 每 个 语句 包含 两 个 文字 的 析 取 ， 那 么 它 是 二 元 合 取 范 式 。 证 明 二 元 
合 取 范 式 的 可 满足 性 问题 在 了 内 。 


. 如 果 一 个 公式 是 合 取 公式 ， 且 它 的 每 个 语句 包含 四 个 文字 的 析 取 ， 那 么 它 是 四 元 合 取 范式 。 证 明 二 元 合 


取 范 式 公 式 的 可 满足 性 问题 是 NP- 完 全 的 。 


.请 为 子 集 一 和 问题 设计 一 个 字符 串 表 示 来 描述 能 在 多 项 式 时 间 内 解决 该 问题 的 非 确定 型 图 灵机 的 计算 。 
. 请 设计 一 个 从 均 分 问题 到 子 集 一 和 问题 的 多 项 式 时 间 归 约 。 定 理 16.4:1 给 出 了 一 个 从 子 集 一 和 问题 到 均 


分 问题 的 多 项 式 时 间 归 约 。 


- 无 向 图 G 的 团 是 一 个 G 的 子 图 ， 该 子 图 中 每 两 个 节点 都 由 一 条 边 连接 。 团 问题 要 解决 的 是 ， 对 于 任意 一 


个 图 G 和 整数 k，G 是 否 有 一 个 大 小 为 大 的 团 。 请 证 明 团 问题 是 NP- 完 全 的 。 
提示 : 为 了 证 明 团 问 题 是 NP- 难 的 ， 需 要 说 明 图 G 的 团 和 补 图 G 的 顶点 覆盖 之 间 的 关系 。G 中 顶点 x 和 y 
之 间 存 在 一 条 边 ， 当 且 仅 当 G 中 不 存在 连接 着 两 个 顶点 的 边 。 


“6. BC = {C,, +, 6] 是 S 的 子 集 的 集 族 。 一 个 子 集 族 C C 覆盖 S 如 果 


s- Uc, 


最 小 覆盖 问题 关心 一 个 集 族 C 是 否 是 这 样 一 个 子 集 族 ， 该 子 集 族 能 够 覆盖 5 且 其 大 小 小 于 等 于 ko 
请 证 明 最 小 覆盖 问题 是 NP- 完 全 的 。 


. 设 C 是 有 限 个 集合 的 集 族 , 是 一 个 小 于 等 于 C 的 势 的 整数 。 请 证 明 判 定 @ 是 否 包含 上 个 不 相交 的 


集合 的 问题 是 NP- 完 全 的 。 


. 最 长 路 径 问 题 的 实例 是 一 个 图 G = (N,A) 和 整数 K |A|。 请 说 明 判 定 G 是 否 有 一 个 非 循环 的 包括 


K 或 更 多 边 的 路 径 的 问题 是 NP- 完 全 的 。 
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“9. 多 处 理 器 调度 问题 的 输入 包括 一 个 任务 集合 A， 一 个 描述 每 个 任务 执行 时 间 的 长 度 函 数 f: ANN, 
和 可 用 的 处 理 器 个 数 ko 该 问题 的 目标 是 找到 一 个 A 的 划分 A, ，A;，…A,， 使 其 能 够 最 小 化 完成 
所 有 任务 所 需 的 时 间 ， 也 就 是 说 在 所 有 划分 上 最 小 化 max {1(A,) | i=1,…n|。 

a) 请 将 多 处 理 器 调度 问题 形式 化 为 一 个 判定 问题 。 
b) 请 说 明 相 关 的 判定 问题 是 NP- 完 全 的 。 

“10. 整数 线性 规划 问题 是 : 给 定 一 个 nxm 的 和 矩阵 A 和 一 个 长 度 为 n 的 列 矢 量 b， 是 否 存在 一 个 列 矢 
量 x 使 得 Axz b? 请 使 用 一 个 三 元 可 满足 性 的 归 约 来 证 明 整 数 线性 规划 问题 是 NP- 难 的 (整数 线 
性 规划 问题 也 在 NP 中; 证 明 要 求 一 些 线性 代数 的 基本 属性 知识 ) 。 

11. 请 说 明 无 向 图 的 货 郎 担 判定 问题 是 NP- 完 全 的 。 

. 项 点 覆盖 问题 最 优化 版 本 的 目的 是 找到 一 个 无 向 图 G 的 最 小 顶点 覆盖 。 近 似 策略 这 样 构造 一 个 柳 
ai VC: 从 G 中 选择 任意 一 个 边 [x,y] 添 加 到 VC 中 ， 从 G 中 删除 [x,y] 和 所 有 与 [x,y] 关 联 的 边 ， 
并 重复 这 个 选择 和 删除 过 程 ， 直 到 VC 覆盖 了 原 图 。 证 明 顶 点 覆盖 问题 的 这 个 策略 需要 一 个 多 项 
式 时 间 的 2 -近似 算法 。 

* 13. 装 箱 问题 最 优化 版 本 的 输入 包括 一 个 集 和 A， 一 个 规模 函数 S: A 一 N， 以 及 一 个 大 小 为 对 的 箱子 ， 
[527] 其 大 小 大 于 最 大 对 象 的 大 小 。 该 问题 的 目的 是 判定 为 了 存放 A 中 的 对 象 所 需要 的 箱子 的 最 小 数 
E, 其 中 箱子 大 小 nn 是 可 以 放 在 一 个 箱子 内 的 对 象 的 大 小 的 总 和 的 上 界 。 首 次 适应 算法 将 对 象 放 
在 能 容纳 它 的 第 一 个 箱子 内 。 如 果 它 不 能 被 当前 的 箱子 容纳 ， 那 么 把 它 放 在 一 个 新 的 箱子 中 。 这 
个 过 程 一 直 重 复 直 到 所 有 的 对 象 都 已 经 存放 。 说 明 装 箱 问题 的 首次 适应 策略 能 生成 一 个 多 项 式 时 
间 的 2 -近似 算法 。 
背包 问题 的 贪心 策略 用 于 选择 适合 背包 的 相对 比值 vy(a)/s(a) 最 高 的 项 a。 这 个 过 程 一 直 重 复 直到 
没有 其 他 的 项 可 以 放 进 背 包 中 。 说 明 使 用 贪心 选 策略 时 ， 存 在 一 个 可 能 错误 的 上 界 。 

- 背包 问题 的 近似 解 可 以 通过 按照 如 下 方式 修改 贪心 策略 获得 : 算法 返回 一 个 贪心 算法 生成 的 解 ， 或 

者 一 个 包含 了 适应 于 背包 的 值 最 大 的 项 的 解 。 证 明 这 种 改动 能 够 为 背包 问题 生成 二 个 2- 近 

似 算法 。 


参考 文献 注释 


Karp [1972] 的 学 术 论 文 证 明了 三 元 可 满足 性 问题 ， 顶 点 覆盖 问题 和 哈密 尔 顿 回 路 问题 的 NP- 完 
全 性 。Garey 和 Johnson [1979] 关于 NP- 完全 性 的 经 典 著作 讨论 了 本 章 涉及 的 所 有 问题 以 及 很 多 其 他 
问题 。 这 本 书 还 包括 了 大 多 数 练习 需要 的 归 约 的 描述 。 

由 于 NP- 完 全 问题 的 重要 性 ， 现 在 已 经 出 现 了 关于 近似 算法 话题 的 扩展 文化 。 上 述 Garey 和 
Johnson 的 著作 、Papadimitriou、Steiglitz [1982] 和 Hochbaum [1997] 的 著作 都 给 出 了 近似 算法 领域 
的 介绍 。Christofides [1976] 为 经 典 的 货 郎 担 问 题 设计 了 一 个 多 项 式 时 间 的 1.5 = 近似 算法 。 第 16.6 
节 介 绍 的 背包 问题 的 近似 方案 来 自 Sahni [1975], Ibbara 和 Kim [1975] 使 用 动态 程序 为 背包 问题 提 
HTO (kin) 的 完全 多 项 式 的 近似 方案 。 

还 有 许多 关于 一 般 算法 理论 的 优秀 书籍 ,包括 Cormen, Leiserson, Rivest 和 Stein [2001], Leb- 
itin [2003], Brassard 和 Bratley [ 1996] 。 除 了 NP- 完全 问题 和 近似 算法 ,这些 著作 包括 了 本 章 中 所 

介绍 的 近似 算法 策略 ， 如 图 算法 、 贪 心算 法 和 动态 程序 策略 等 。 


一 
N 


= 


* 
— 
Un 


第 17 章 ， 其 他 复杂 性 类 


复杂 性 理论 关心 的 是 ,为 了 解决 判定 问题 或 计算 函数 ， 对 判定 语言 成 员 资格 问题 所 需要 的 资源 进 
. 行 估计 。 时 间 复 杂 性 的 研究 已 经 把 可 以 被 多 项 式 时 间 算法 求解 的 类 ?看 作 是 高 效 可 解 问题 。 我 们 在 本 
章 的 开始 首先 讨论 几 个 可 以 从 类 了 和 类 NP 推导 出 来 的 时 间 复 杂 性 类 的 属性 。 然 后 研究 计算 所 需要 的 
时 间 和 空间 之 间 的 关系 。 最 后 ， 我 们 使 用 空间 复杂 性 来 说 明 存 在 不 能 被 任何 多 项 式 时 间 算 法 或 多 项 式 
空间 算法 解决 的 问题 。 


17.1 派生 的 复杂 性 类 


关于 易 解 性 的 研究 介绍 了 类 了 的 语言 在 多 项 式 时 间 内 是 确定 地 可 判定 的 ， 通 过 非 确定 的 计算 ， 类 
NN 了 的 语言 也 是 多 项 式 时 间 可 判定 的 。 这 两 种 情况 是 否 相同 的 问题 目前 仍 是 未 知 的 。 现 在 我 们 考虑 其 
他 几 个 能 够 帮助 更 好 地 考察 ? = NP 问题 的 语言 类 。 非 常 有 趣 的 是 ， 这 些 类 的 属性 通常 依赖 于 人 和 
N 了 之 间 的 关系 。 下 面 的 讨论 主要 是 在 ? 关 N? 假 设 下 进行 的 。 然 而 ， 在 任何 使 用 了 这 个 假设 的 结果 
中 ， 这 个 条 件 将 会 被 显示 地 叙述 。 

AP Ail NPC 都 是 NP 了 的 非 空子 集 , 但 是 这 两 个 类 之 间 有 什么 关系 ? 根据 定理 15.6.2, mR 
(了 NNPE) EF, MAP = NP. Ait, EP e NP 的 假设 下 ，P 了 和 NPC 一定 不 相交 。15.9 3509 
AGL T P se NP 时 了 了 和 NP 了 PC 的 内 容 。 当 我 们 看 到 这 个 图 时 ， 立 即 会 想到 这 样 一 个 问题 ，NP 中 是 
否 存在 不 在 叶 或 者 NPC 中 的 语言 ? 

我 们 定义 一 个 语言 族 N 了 J 来 表示 所 有 在 NP 但 是 不 在 NPC 或 者 ?中 的 语言 ， 其 中 字母 1] 表示 中 
间 的 。 这 种 上 下 文中 ， 词 中 间 的 的 最 好 解释 是 通过 解决 判定 问题 体现 出 来 的 。 一 个 NPI 中 的 问题 不 
是 NP- 难 的 ， 因 此 也 不 被 看 作 跟 NPC 中 的 问题 那样 难 。 另 一 方面 ， 由 于 它 不 在 ?中 ， 因 此 我 们 认为 
它 比 了 类 中 的 问题 更 难 。 词 语 中 间 的 来 自 于 这 样 一 种 解释 ， 即 NPI 中 的 问题 比 中 类 中 的 问题 难 但 是 
又 不 像 NPC 中 的 问题 那么 难 。 

WRP = NP ， 那么 NP 了 J 类 为 空 。 定 理 17.1.1 RAAHE, "GRE T UR DP ANP, BAH 
间 问 题 是 存在 的 。 

定理 17.1.1 wRPANP, HAN?) 类 非 空 。 

我 们 把 字母 表 上 的 语言 L 的 补 表示 为 L， 它 包含 所 有 不 在 工 PEA, 也 就 是 说 已 = * 二: 
一 个 语言 家 族 了 是 封闭 的 ， 如 果 当 Le 了 于 时 Le 于。 家 族 了 对 于 补 运算 是 封闭 的 。 一 个 可 以 在 多 项 式 时 
间 内 接收 语言 的 确定 型 图 灵机 可 以 被 转换 成 在 同样 的 多 项 式 边界 中 接收 其 补 集 。 这 个 转换 仅仅 包括 交 
换 图 灵机 的 接收 状态 和 拒绝 状态 。 

不 确定 性 的 不 对 称 性 对 接收 语言 的 机 器 以 及 接收 其 补 的 机 器 的 复杂 性 有 重大 影响 。 为 了 得 到 肯定 
答案 ,我 们 所 需要 的 仅 是 一 个 可 以 验证 肯定 答案 的 不 确定 的 “猜想 ”"。 仅 当 所 有 猜想 失败 时 ， 我 们 才 
会 得 到 一 个 否定 的 答案 。 我 们 用 可 满足 性 问题 来 说 明 一 个 语言 及 其 补 的 不 确定 型 接收 的 复杂 性 的 不 对 
称 性 。 

可 满足 性 问题 的 输入 是 布尔 变量 集 了 上 的 一 个 合 取 范 式 公式 u, WME u 是 可 满足 的 那么 输出 为 是 ， 
否则 输出 否 。 定 理 15. 5. 2 描述 了 一 个 在 多 项 式 时 间 解 决 可 满足 性 问题 的 非 确定 型 机 器 。 它 通过 猜测 V 
上 的 真 值 赋值 来 完成 计算 。 检 查 是 否 一 个 真 值 赋值 满足 公式 4 是 一 个 直接 可 以 在 长 度 的 多 项 式 时 间 
内 完成 的 过 程 。 

可 满足 性 问题 的 补 是 指 判断 是 否 一 个 合 取 范 式 公 式 是 不 可 满足 的 ; 也 就 是 说 ， 它 不 能 被 任意 的 真 
值 赋值 满足 。 如 果 u 不 能 被 所 有 可 能 的 真 值 赋值 满足 ， 那 么 我 们 可 以 得 到 肯定 的 答案 。 解 决 “ 不 可 满 
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足 性 问题 ”的 一 个 非 确 定型 策略 要 求 一 个 能 够 验证 u 的 不 可 满足 性 的 猜想 。 这 个 猜想 不 能 只 是 真 值 赋 
值 ， 因 为 发 现 一 个 不 满足 w 的 真 值 赋值 不 足以 说 明 是 不 可 满足 的 a 直觉 上 , 我们 需要 知道 所 有 可 能 
的 真 值 赋值 时 u 的 真 值 。 如 果 card( V) =n， 那 么 我 们 需要 检查 2" 个 真 值 赋值 。 因 此 ,说 这 个 问题 在 
NP 内 似乎 是 合理 的 。 注 意 我 们 在 上 一 个 句子 中 使 用 了 词语 直觉 上 和 似乎 是 。 这 么 说 是 因为 不 可 满足 
性 问题 是 否 在 NF 了 中 仍然 是 未 知 的 。 
除了 考虑 可 满足 性 问题 的 补 ， 我 们 还 要 检查 所 有 NP 中 的 语言 的 补 所 组 成 的 语言 族 。 这 个 族 是 
co- NP - IL| Le NPI, 
定理 17.1.2. de X NP Aco-NP, MAPANP, 
- TERA: 如 前 所 述 ， 了 在 补 运算 上 是 封闭 的 。 如 果 和 Ny9 对 于 补 运算 不 封闭 ， 那 么 这 两 个 语言 类 不 能 
相同 。 图 

定理 17. 1. 2 为 回答 了 = N 了 问题 提供 了 另外 一 种 方法 。 找 到 一 种 语言 Le NPAL¢e NP 就 足够 
To NP =co-NP 的 证 明 不 能 回答 于 和 NTF 了 是 否 相 同 的 问题 。 此 时 ,是 否 NP 了 = co- NP 了 仍然 是 未 知 
的 。 正 如 大 家 通常 所 相信 的 天 NP , NP zco- NP 也 是 理论 计算 机 科学 家 的 一 致意 见 。 然 而 ， 大 
多 数 人 的 意见 不 能 判定 数学 属性 ， 人 们 仍然 在 为 了 证 明 这 些 不 等 式 而 努力 。 定 理 17.1.3 HULA NP Al 
co- NP 了 的 相等 关系 提供 了 一 种 方法 。 

定理 17.1.3 如 果 存 在 一 个 N 了 -完全 语言 使 得 Le NP ,那么 NP =c0- NP, 

证 明 : (Rit L 是 满足 上 述 条 件 的 语言 。 我 们 首先 要 说 明 的 是 ， 在 这 些 条 件 下 ,任意 一 个 NP 中 的 
语言 Q 的 补 也 在 NP 了 中。 因为 L 是 NP- 完 全 的 ， 所 以 存在 一 个 从 Q 到 工 的 多 项 式 时 间 归 约 。 这 个 归 
约 同 样 也 是 Q 到 工 的 归 约 。 

根据 我 们 的 假设 Le NP ， 一 个 非 确 定型 图 灵机 可 以 在 多 项 式 时 
间接 收 志 。 结 合 执行 从 Q 到 工 的 归 约 的 机 器 和 接收 工 的 机 器 ， 我 们 可 以 
得 到 一 个 能 在 多 项 式 时 间 内 接收 Q 非 确定 型 机 器 。 因 此 ，co- 
NP CNP. 

AT iEHA NP = co- NP ,我们 必须 证 明 反 向 的 结论 。 设 Q 是 
N 了 中 的 任意 一 个 语言 。 根 据 上 述 证 明 ，Q 也 在 NP 中 。 所 以 Q 的 补 ， 
也 就 是 Q, Æ co- N 了 中 。 m 

我 们 可 以 使 用 可 满足 性 问题 和 它 的 补 来 初始 化 co- NP 了 族 的 检查 。 
我 们 曾经 说 相信 可 满足 性 问题 的 补 不 在 NP 中 似乎 是 合理 的 。 根 据 定 
理 17.1.2, Lo 在 N 了 中 ， 当 且 仅 当 和 NP =co- NP. El 17-1 RAT 
STEM HP. NP, NPC 和 co- NT 了 之 间 的 关系 。 


17.2 空间 复杂 性 


前 面 几 章 都 关注 于 图 灵机 和 判定 问题 的 时 间 复 杂 性 。 我 们 也 可 以 同样 的 选择 去 分 析 计 算 所 要 求 的 
空间 。 在 高 层 算法 问题 求解 中 ， 程 序 所 要 求 的 时 间 和 存储 通常 是 相关 的 。 我 们 将 说 明 一 个 图 灵机 的 时 
间 复 杂 性 提供 了 所 需 空间 的 上 界 ， 反 之 亦 然 。 除 非 其 他 说 明 ， 我们 所 介绍 的 空间 复杂 性 对 于 确定 型 和 
非 确 定型 图 灵机 都 成 立 。17.3 节 将 介绍 在 接收 语言 时 ， 我 们 为 了 限制 一 个 计算 可 得 的 空间 所 做 的 
努力 。 

图 17-2 显示 的 图 灵机 结构 用 于 度量 一 个 计算 所 需要 的 空间 。 带 1 包括 输入 上 且 是 只 读 的 。 输入 长 度 
为 n 的 字符 串 时 ,输入 带 的 带头 必须 保持 在 位 置 0 和 n+1 之 间 。 图 灵机 可 以 读 输 入 带 但 是 在 其 他 带 上 
执行 操作 。 提 供 一 个 输入 带 可 以 分 离 输 入 需要 的 空间 和 计算 所 需要 的 空间 。 有 时 我 们 把 满足 前 述 条 件 
的 图 灵机 叫做 离线 图 灵机 (off-line turing machine) ， 因 为 输入 可 以 看 作 是 被 离线 地 优先 于 计算 提供 
的 ， 并 且 它 不 包括 在 资源 使 用 的 评估 中 。 除 非 其 他 说 明 ， 我 们 假设 本 章 后 续 部 分 中 的 图 灵机 都 是 针对 
空间 复杂 性 分 析 而 设计 的 。 





图 17-1 QeNPHN?»sx 
co- NP 时 的 包含 关系 
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图 17-2 空间 复杂 性 的 图 灵机 结构 


EX 17.2.1 一 个 k+1 带 图 灵机 M 的 空间 复杂 性 (space complexity) 是 一 个 函数 sc: NN, 
当 图 灵机 M 被 一 个 长 度 为 于 的 字符 串 初 始 化 时 ，scwv(7m) 是 M 的 计算 从 其 任意 工作 带 上 读 的 带 方 格 的 
最 大 值 。 

这 个 定义 对 于 确定 型 和 非 确定 型 图 灵机 都 适用 。 对 于 非 确定 型 机 器 ， 每 个 长 度 为 二 的 输入 字符 串 
的 可 能 的 计算 上 都 会 出 现 这 个 最 大 值 。 与 时 间 复 杂 性 不 同 ， 我 们 不 会 假设 图 灵机 的 计算 对 每 个 输入 都 
停机 。 即 使 计算 永 不 终止 ， 机 器 的 带头 仍然 可 以 保持 在 带 上 初始 片段 的 有 限 长 度 内 。 

空间 复杂 性 永远 大 于 0。 即使 一 个 图 灵机 不 发 生 任何 转换 ， 机 器 也 必须 读 工作 带 的 最 左 端 位 置 以 
便 作 此 决定 。 由 于 空间 复杂 性 只 度量 工作 带 ， 因 此 scy(n) <n 是 可 能 的 。 也 就 是 说 ， 计 算 所 需要 的 空 
间 可 能 小 于 输入 的 长 度 。 在 例 17.2.1 中, 我们 设计 了 另外 一 个 接收 回 文 的 机 器 来 说 明 一 个 空间 复杂 
HEX O(log: (n) ) 的 计算 。 

例 17.2.1 例 14.3.1 构造 了 一 个 接收 la,b} 上 的 回 文 的 双 带 图 录 机 。 这 个 机 器 遵循 了 为 分 析 空 间 
复杂 性 而 设计 的 机 器 的 描述 。 输 入 带 是 只 读 的 并 且 带 头 只 读 输入 字符 串 和 输入 另 一 端的 空白 。M' 的 空 
间 复 杂 性 是 n+2; 计算 在 带 2 上 重新 生成 输入 并 且 反 向 地 读 人 字符 串 的 方式 来 比较 带 1 和 带 2 上 的 字 
符 串 。 

现在 ,我 们 设计 一 个 空间 复杂 性 sey (n) = O(log, (n) ) 的 接收 回 文 的 三 带 机 器 Ms 王 作 带 用 作 计 
数 器 和 记录 自然 数 的 二 进 制 表示 。 我 们 的 策略 是 ,使 用 计数 器 识别 和 比较 字符 串 的 第 i 个 元 素 和 右边 
第 i 个 元 素 。 如 果 它 们 匹配 ， 那 么 计数 器 增加 并 且 比 较 第 i+1 个 元 素 。 这 个 过 程 持续 到 发 现 一 组 不 匹 
配 的 元 素 或 者 所 有 元 素 都 被 比较 过 了 。 在 前 一 种 情况 下 ,字符 串 被 拒绝 ， 而 在 后 三 种 情况 下 字符 串 被 
接收 。 

输入 的 长 度 为 n 时 ，M 的 一 个 计算 包括 如 下 步骤 : 

. 在 带 3 的 位 置 1 写 人 1。 
. 将 带 3 拷贝 到 带 2。 
AE SE SR Gs TE EE KN NOU ANCSNENS: 
. 当 带 2 上 的 数字 不 是 0 时 ， 
a) 把 输入 带 的 带头 向 右 移动 一 格 。 
b) 减 小 带 2 上 的 值 。 | 
.如 果 输 入 带 上 读 入 的 字符 为 空 ， 停 机 并 接收 字符 串 。 
使 用 机 器 状态 记录 输入 的 第 i 个 字符 。 
把 输入 带 的 带头 移动 到 紧邻 输入 右 侧 的 位 置 ( 带 位 置 n+1)。 
. 把 带 3 拷贝 到 带 2。 
. 当 带 2 上 的 字符 不 是 0 时 ; 
a) 把 输入 带 的 带头 向 左 移动 一 格 。 
b) 减 小 带 2 ER. 
10. 如 果 第 (n -i+1) 个 字符 与 第 i 个 字符 匹配 ,那么 增加 带 3 EROR, 带头 返回 到 它们 的 初始 位 
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置 ， 并 且 计 算 回 到 步骤 2 继续 。 否 则 计算 拒绝 该 输入 。 

带 2 和 带 3 上 的 操作 可 以 增加 和 减 小 一 个 自然 数 的 二 进 制 表示 。 因 为 n+1 是 写 入 到 这 些 带 上 的 最 
大 值 ， 因 此 每 个 带 至 多 使 用 [log, (n+1)1+2 个 带 上 的 方 格 。 口 

我 们 把 一 个 离线 图 灵机 叫做 s(n) 空间 边界 的 (space-bounded) ， 如 果 输 入 长 度 为 n 时 计算 的 工作 
带 所 使 用 的 带 上 方 格 至 多 为 max |1,s(n)1。 空 间 复杂 性 函数 scw(n) 描 述 了 输入 nn 时 M 的 计算 实际 所 
需要 的 最 大 空间 ， 其 中 可 能 没有 达到 空间 边界 提供 的 上 界 。 正 如 前 面 关 于 空间 复杂 性 的 描述 ， 即 使 一 
个 图 灵机 的 计算 不 会 终止 ， 它 仍然 可 以 是 空间 边界 的 。 

我 们 可 以 使 用 一 个 只 有 一 条 带 的 s(n) 空间 边界 的 机 器 来 模拟 空间 边界 s(n) Sn 的 k+1 带 图 灵机 
M。 这 与 时 间 复 杂 性 的 度量 不 同 ， 带 数量 的 归 约 会 导致 时 间 复 杂 性 的 增加 。 这 个 证 明 使 用 了 8.6 节 介 
绍 的 从 一 个 上 带 图 灵机 到 2k +1 道 图 灵机 的 构造 。 结 果 ， dones om boni eai die 
多 带 图 灵机 的 任何 一 个 工作 带 读 入 的 最 大 值 。 下 面 的 定理 对 上 述 内 容 进 行 了 总 结 。 

定理 17.2.2 设 LL 是 一 个 能 被 空间 边界 s(n) =n t k+1 带 图 灵机 M 接收 的 语言 。 那 么 T T 
被 一 个 s(n) 空间 边界 的 单 工作 带 图 灵机 接收 。 

正如 定理 17. 2.2， 我们 会 很 频繁 地 使 用 到 图 灵机 空间 复杂 性 sc (n) Sn 或 者 空间 边界 s(n) zn 的 
假设 。 在 定理 中 增加 这 些 条 件 是 为 了 保证 至 少 n 个 带 方 格 可 得 。 由 于 空间 复杂 性 函数 本 身 就 是 一 个 空 
间 边 界 ， 因 此 第 一 个 条 件 蕴 含 第 二 个 条 件 。 反 之 不 成 立 。 例 17. 2. 1 描述 的 图 灵机 M Æ s(n) =n+2 空 
间 边界 的 ,但 是 它 的 空间 复杂 性 不 满足 sc (n) Sn, 

尽管 我 们 对 空间 复杂 性 的 定义 是 基于 多 带 离线 图 灵机 的 计算 的 ， 但 是 空间 边界 的 表示 对 于 单 带 图 
灵机 同样 适用 。 如 果 一 个 单 带 图 灵机 使 用 的 带 方 格 的 最 大 数量 至 多 为 max |n € 1,s(n)], 那么 这 个 单 
带 图 灵机 是 s(n) 空 间 边 界 的 。 当 仅 有 一 条 带 时 ， 存 储 输 入 所 需要 的 空间 也 包含 在 边界 中 。 

根据 一 个 机 器 是 s(n) zn 空间 边界 的 假设 和 定理 17.2.2, 方便 时 我 们 可 以 把 注意 力 限 制 在 一 条 工 
作 带 上 。 事 实 上 ， 在 空间 边界 s(n) zn 时 任何 能 够 被 接受 的 语言 都 能 被 一 个 满足 同样 空间 边界 的 单 带 
确定 型 图 灵机 接受 (练习 9)。 这 个 证 明 使 用 的 归 约 与 从 多 道 机 器 到 单 道 机 器 的 归 约 相同 。 

在 研究 空间 复杂 性 时 选择 离线 图 灵机 的 原因 是 为 了 采纳 一 个 适用 于 所 有 空间 边界 分 析 的 图 灵机 模 
型 。 许 多 有 趣 的 语言 可 以 被 空间 边界 小 于 输入 长 度 的 机 器 所 接收 。 特 别 地 ， 人 们 广泛 地 研究 了 可 以 被 
log, (7m) 空 间 边界 图 灵机 接收 的 语言 类 。 然 而 ， 我 们 的 注意 力 集中 于 这 样 的 问题 ， 它 们 可 能 需要 大 量 
的 资源 ， 并 且 对 于 这 些 问 题 而 言 ， 输 入 可 用 的 空间 至 少 等 于 输入 规模 是 合理 的 。 


17.3 空间 复杂 性 和 时 间 复 杂 性 的 关系 


po 一 个 带头 在 一 个 计算 中 可 读 的 带 方 
格 的 数量 受制 于 计算 中 转换 的 次 数 。 

定理 17.3.1 KRM 是 一 个 时 间 复 杂 性 为 fcw(n) -fa& bl PRM APA sey(n) <f(n) +1. 

WEBB: 当 M 的 每 一 个 转换 都 把 工作 带 的 带头 右 移 时 ， tet gy 
从 工作 带 读 入 的 最 大 带 方 格 数 量 是 fn) +1。 

由 于 机 器 可 以 多 次 读 人 带 的 一 个 特定 段 ， Piscine sane SER ROR RU AUTORI ur 
杂 。 我 们 使 用 一 个 双 带 图 灵机 M 来 说 明 可 以 根据 机 器 的 空间 复杂 性 得 到 一 个 确定 型 图 灵机 的 计算 的 
时 间 边 界 。 我 们 假设 M 对 所 有 输入 字符 串 都 停机 ， 这 是 时 间 复 杂 性 的 要 求 。 从 双 带 机 器 到 上 + 1 带 机 


器 的 泛 化 是 简单 的 。 
定理 17.3.2. 设 M 是 一 个 可 以 对 任意 输入 字符 串 停 机 的 双 带 图 灵机 ，M 的 空间 边界 是 s(n)。 那 
4 tc,(n) <m - s(n) + (n+2) - 7, 其 中 mm 是 M 的 状态 的 数量 , 是 M 的 带 字符 的 数量 。 


证 明 : SEM-(Q, XZ,D,0,4,,F) É— "XU EE BL, m = card(Q) ,t= card(T) 。 对 于 每 个 长 度 为 
n 的 输入 ， 空 间 边 界 把 M 的 计算 约束 为 至 多 是 带 2 上 的 s(n) 位 置 。 通 过 把 计算 限制 在 带 上 有 限 长 度 的 
片断 , 我 们 能 够 计算 M 所 进入 的 不 同 机 器 配置 的 数量 。 

工作 带 的 每 一 个 位 置 可 以 含有 上 个 字符 中 的 任意 一 个 ， 这 导致 了 产 ”个 可 能 的 配置 。 带 工 的 带头 
可 以 任意 地 读 前 n+2 个 位 置 ， 带 2 的 带头 可 以 从 位 置 0 到 位 置 s(n) -1 读 入 。 因 此 ,一 共有 s(z) - 
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(n+2) - 六 "个 可 能 的 机 器 配置 和 带头 位 置 的 组 合 。 对 于 任意 一 个 这 样 的 组 合 ， 机 器 可 以 处 于 六 个 状 
态 中 的 一 个 ， 这 样 就 产 成 了 ms(n) = (n*2) zx" 个 不 同 的 配置 。 

确定 型 机 器 的 配置 的 重复 说 明 机 器 已 经 进入 了 一 个 无 限 循环 。 因 为 M 对 所 有 计算 停机 ， 所 以 计 
算 必 须 在 达到 m…s(n)… (n+2)…1"” 次 转换 前 停机 。 m 

对 于 一 个 非 确定 型 机 器 ,一 个 终止 的 计算 可 以 有 多 于 可 能 的 配置 的 数目 转换 次 数 。 当 一 个 配置 被 
重复 时 ， 计 算 可 以 选择 一 个 不 同 的 转换 。 在 推论 17.3.3 中 ,我 们 使 用 配置 数据 的 限制 来 为 任何 二 个 
空间 边界 图 灵机 接收 字符 串 所 需要 的 转换 次 数 产生 一 个 指数 级 的 边界 。 边 界 以 指数 形式 给 出 ， 化 简 了 
下 一 个 部 分 中 确定 型 和 非 确定 型 计算 所 需要 的 空间 数量 的 比较 。 根 据 定理 17. 2.2; 考虑 只 有 一 个 工作 
带 的 图 灵机 就 已 经 足够 了 。 

推论 17.3.3 设 M 是 一 个 空间 边界 8(n) 宇 Ni 的 图 吴 机 。- 存 在 一 个 依赖 于 M 的 状态 数量 和 和 带 字 符 
数量 的 常数 c， 使 得 任意 可 以 被 M 接收 的 长 度 为 nn 的 字符 囊 也 可 以 被 一 个 至 多 有 c"" “次 转换 的 计算 
接收 。 

证 明 : 我 们 再 次 设 M S (Q, 了,T,6,4qo,F) 是 一 个 双 带 图 灵机 ，m = card( Q) ,t=card(T)。 根 据 定 
理 17.3.2 WEH, 输入 长 度 为 n 时 ,任何 一 个 计算 都 存在 ms(n)… (n+2)… "个 可 能 的 配置 。 机 
器 配置 数量 的 指数 级 边界 的 获得 使 用 下 面 的 不 等 式 : 

(m2)s(n) <3", 
M n<s(n)H s(n) >0 时 该 不 等 式 成 立 。 我 们 可 以 通过 把 m: s(n). (n +2) - CO 的 项 替换 成 把 s(n) 
当 指 数 的 函数 来 获得 转换 次 数 的 边界 : 
m-*s(n) -(n«2) Sm © s(n) - (n2) - f? 


<m s(n) Mee ti » po 


c 可 以 直接 根据 图 灵机 M. 的 状态 个 数 和 带 符号 个 数 获得 。 
M 的 任何 一 个 多 于 c 次 转换 的 计算 都 必须 重复 一 个 配置 一 个 接收 字符 串 w 的 这 种 形式 的 转换 
可 以 写作 
qo: .BwB,. BB 
Eq; Bu.vB,x. y 
E-q: Bu.vB,x.y 
Eq: Bu'.v'B,x'. y', 
其 中 ， 第 一 个 分 号 后 的 字符 串 表 示 带 1， 第 二 个 字符 串 表 示 带 2， 点 表示 带头 正在 读 右 边 的 字符 。 从 
计算 中 删除 重复 配置 的 部 分 可 以 得 到 另 一 个 长 度 更 小 的 接收 计算 : 
qo: . BwB,. BB 
F4; Bu. vB,x. y 
Fg: Bu'.v'B,x'. y' 
这 个 过 程 可 以 一 直 重复 直到 产生 一 个 长 度 小 于 c MITE 图 
图 灵机 M 接收 字符 串 所 需 的 转换 次 数 的 上 界 可 以 用 来 构造 一 个 能 够 接收 同样 语言 、 有 同样 空间 
复杂 性 并 对 所 有 输入 字符 串 停机 的 机 器 。 其 基本 思想 是 给 M 添加 一 个 带 用 于 记录 转换 的 次 数 。 我 们 
把 计数 带 初始 化 为 推论 17.3.3 提供 的 边界 。 每 个 发 生 一 次 转换 ， 计 数 器 减 1。 如 果 计 数 器 的 值 为 0， 
那么 计算 停止 并 拒绝 该 输入 。 这 个 构造 中 ;我 们 惟一 关心 的 是 要 保证 技术 带 使 用 的 带 不 超出 Mi 的 空 
间 边界 允许 的 范围 。 我 们 可 以 通过 选择 一 个 合适 的 底 b 并 把 技术 带 上 的 数字 表示 成 以 b 为 底 的 系统 来 
做 到 这 一 点 。 
推论 17.3.4， 设 工 是 一 个 可 以 被 图 灵机 在 空间 边界 .35(7) Sn 内 接收 的 语言 。 那 么 LL 可 以 被 二 个 
ZAAR 2g s( n) 且 对 任何 输入 都 停机 的 图 灵机 M' 接 收 。 
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一 个 空间 边界 s(n) 是 完全 空间 可 构造 的 (full space constructible) ， 如 果 存 在 一 个 图 灵机 M， 并 且 其 
每 一 个 长 度 为 n 的 字符 串 的 计算 正好 访问 s(n) 个 带 方 格 。 如 果 M 是 一 个 空间 复杂 性 为 scw (n) =5(n) = 
n 的 图 灵机 ， 那 么 s(n) 是 完全 空间 可 构造 的 (练习 5)。 完 全 空间 可 构造 函数 的 集 和 包括 n2" .nl 和 多 
数 普通 的 数论 函数 。 此 外 ， 如 果 s, (n) Al s,(n) 都 是 完全 空间 可 构造 函数 ， 那 么 s,(n)s,(n) .2"(n) 和 
s, (n) ? 也 都 是 都 是 完全 空间 可 构造 函数 。 以 上 发 现 使 我 们 得 到 一 个 结论 ， 即 任何 把 2 做 为 指数 链 的 
函数 
s(n) 2277 
是 完全 空间 可 构造 函数 。 因 此 ， 图 灵机 计算 所 需要 的 空间 数量 没有 限制 。 定 理 17. 3.5 列 出 了 二 些 条 
件 ， 在 这 些 条 件 下 ,增加 计算 可 用 的 空间 会 导致 可 以 接收 的 语言 族 的 增加 。 
定理 17.3.5 iks(n)endes(n)2nXA N35] N H dd, KE 
ir" (n) 
ER -0 
并 且 s, 是 完全 空间 可 构 的 -那么 存在 一 个 可 以 被 % (1) 空 间 边 界 的 图 灵机 接收 的 语言 L, mL AAR 
任何 si(n) 空 间 边 界 的 图 灵机 接收 。 
证 明 : 我 们 构造 一 个 五 带 s,(n) 空 间 边 界 的 图 灵机 M， 并 使 其 语言 不 能 被 任何 s Cn) 空间 边界 的 
图 灵机 接收 。M 的 输入 是 10,1|} 上 的 字符 串 ， 并且 计算 把 这 样 一 个 字符 串 的 解释 用 作 一 个 双 带 图 灵机 。 
当 运 行 输入 字符 串 w 时 ，M 的 计算 包含 了 两 个 图 灵机 计算 的 模拟 。 第 一 个 配置 M 的 一 个 带 以 保证 
5 7) 空间 边界 。 第 二 个 配置 模拟 给 字符 串 w 编码 的 机 器 的 计算 。 当 运行 字符 串 w 时 ， 我 们 称 之 为 
M,。 我 们 给 出 一 个 对 角 化 证 明 来 说 明 M 的 语言 不 被 s,(n) 空间 边界 的 图 灵机 接收 。 
我 们 使 用 14. 6 节 介 绍 的 多 带 图 灵机 的 编码 ， 但 是 我 们 允许 在 开始 编码 时 的 000 之 前 有 任意 多 个 
1, At, WR welo,1] "是 图 灵机 的 编码 ， 那 么 字符 串 1w,11w,111w... 是 同一 个 机 器 的 编码 。 通 过 
这 个 改动 ，{0,1| "字符 串 的 枚 举 包括 了 每 个 图 灵机 的 无 限 个 编码 。 任 何 双 带 图 灵机 编码 要 求 的 字符 
Bw 都 可 以 被 看 作 是 双 带 、 单 状态 且 无 转换 的 机 器 。 
输入 为 w 时 ，M 的 计算 开始 于 把 带 5 上 的 第 s(n) -1 个 位 置 标 记 为 1。 因 为 s,(n) 是 完全 空间 可 
构造 的 ， 所 以 存在 这 样 一 个 图 灵机 ， 当 它 运行 输入 w 时 正好 使 用 了 's;(n) 个 方 格 。 输 入 为 w 时 这 个 机 
器 的 计算 可 以 在 带 2 和 带 4 上 模拟 ,并 且 计 算 中 被 访问 的 最 右边 的 方 格 被 记录 在 带 5 上 。 
在 说 明了 带 边界 后 ，M 在 带 2 和 带 4 上 模拟 输入 为 w 时 机 器 M, 的 计算 。 在 这 个 阶段 开始 时 ，M 
如 下 图 所 示 : 
在 模拟 M, 的 过 程 中 ， 带 3 和 带 5 的 带头 区 


同步 地 移动 。 如 果 带 头 试图 移动 到 和 带 5 上 最 有 [CTTTT iT ams 
边 的 标记 ， 那 么 M 的 计算 停机 且 拒绝 该 输入 。 eI - Iu 


这 样 能 够 保证 M 是 s, (n) 空间 边界 的 。 如 果 计 [ [ [ ] ee 状态 
算 达 到 了 空间 边界 并 没有 终止 并 且 M, 拒绝 w 


停机 ， 那 么 机 器 M 接收 输入 字符 串 wo CLIT C ec I 
现在 我 们 来 说 明 L(M) 不 能 被 任何 s,(n) 空 ie -———u M, 的 模拟 
间 边 界 的 图 灵机 M' 接 收 。 根 据 推论 17. 3.4, 我 
们 可 以 假设 M' 对 所 有 输入 停机 。M' 的 编码 会 IL A eras 
导致 出 现 10,11}' 枚 举 的 无 限 多 项 。 因 为 BaP 
inf 51(7) _ 
peel m) 
所 以 存在 某 个 n 宇 length(w) 使 得 s, (n) <s;(n)。 我 们 可 以 通过 在 字符 串 w 开头 追加 1 来 生成 一 个 长 度 
正好 为 n 的 M' 的 w' 的 编码 。 
现在 我 们 考虑 运行 输入 w' 时 机 器 M 的 计算 。 由 于 s (n) < s,(n)， 所 以 M 有 足够 的 空间 来 模拟 
M' 的 计算 。 因 此 M w, 当 且 仅 当 M' 不 接收 w 因此 ，L(M) 关 L(M') 。 据 此 可 得 环 存 在 能 够 接 
ie L(M) ÉI s, (z) 空 间 边界 的 图 灵机 。 m 


0, 
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2" $n 2" 的 空间 可 构造 性 结合 定理 17.3. 5 可 以 保证 存在 这 样 的 语言 L，L 不 能 被 任何 空间 边界 为 
2 的 机 器 接收 。 后 面 的 边界 比 任何 多 项 式 的 增长 速度 都 快 。 因 此 不 存在 能 够 接收 蕊 的 多 项 式 空间 复杂 
性 图 灵机 。 由 于 空间 复杂 性 为 时 间 复 杂 性 提供 了 一 个 边界 ， 所 以 工 不 能 被 在 多 项 式 时 间接 收 。 故 而 语 
言 工 的 成 员 资格 问题 是 难 解 的 。 

在 没有 确定 一 种 空间 和 时 间 复 杂 性 不 是 多 项 式 边界 的 特定 语言 的 情况 下 ， 上 述 的 证 明说 明了 难 解 
语言 的 存在 性 。 我 们 将 在 17. 5 节 说 明 ， 关 注 于 使 用 正则 表达 式 描述 的 语言 的 问题 需要 指数 级 的 空间 。 


17.4 了 -空间 ，XNy- 空 间 和 萨 维 奇 定理 


K P MA N 了 分 别 包 含 了 能 被 确定 型 和 非 确定 型 图 灵机 在 多 项 式 时 间 内 接收 的 语言 。 我 们 可 以 使 
用 一 种 类 似 的 方式 定义 可 以 被 这 样 的 图 灵机 接收 的 语言 ， 这 些 图 灵机 的 计算 所 需要 的 空间 数量 仅 随 输 
入 长 度 多 项 式 地 增长 。 

定义 17.4.1 一 个 语言 L 是 多 项 式 空间 可 判定 的 (decidable in polynomial space) ， 如 果 存 在 一 个 
$c, e O( n') t$ EB L $9 EL X JU M, 其 中 r 是 一 个 独立 于 nn 的 自然 数 。 确 定型 图 灵机 多 项 式 时 间 可 判 
定 的 语言 族 记 做 于 -空间 。 类 似 地 ， 非 确定 型 图 灵机 多 项 式 时 间 可 判定 的 语言 族 记 做 N 了 -空间 。 

关于 这 些 新 的 复杂 性 类 ， 有 一 些 明显 的 结论 。 显 然 ， 了 -空间 C NF 了 -空间 。 此 外 ,根据 定理 
17.3.1, PC 了 -空间 且 N 了 C NFP- 空间 。 自 20 世纪 60 年 代 被 提出 以 来 ， 了 是 否 是 NP 的 一 个 子 集 
是 一 个 尚未 解决 的 公开 的 问题 。 类 似 的 空间 复杂 性 问题 的 答案 是 已 知 的 ， 即 了 -空间 = NP- 空 间 。 时 
间 和 空间 复杂 性 的 本 质 区别 是 空间 可 以 在 计算 中 被 复 用 。 

我 们 将 说 明 ， 每 一 个 能 被 非 确 定型 s(n) 空间 边界 的 图 灵机 接收 的 语言 都 能 确定 地 在 空间 边界 
O(s(n)”) 内 被 接收 。 因 此 我 们 立即 可 以 得 知 ， 一 个 能 被 非 确定 型 图 灵机 在 多 项 式 空间 内 接收 的 语言 
能 够 被 确定 型 图 灵机 在 多 项 式 空间 内 接收 。 像 往常 一 样 ， 我 们 将 把 我 们 的 注意 力 集中 在 双 带 图 灵机 上 。 

根据 非 确定 型 图 灵机 构造 一 个 等 价 的 确定 型 图 灵机 ， 必 须 描 述 一 个 能 够 系统 地 检查 非 确定 型 机 器 
的 所 有 备用 计算 的 方法 。 首 先 我 们 考虑 输入 为 w 时 ， 构 造 非 确定 型 图 灵机 的 备用 计算 的 标准 方法 所 需 
要 的 空间 。 在 这 种 方法 中 ， 空 间 分 析 的 一 个 严格 的 特性 是 需要 存储 当前 计算 中 能 够 生成 成 功 计算 的 所 
有 机 器 配置 。 我 们 使 用 一 个 栈 来 维护 和 访问 这 个 配置 ， 从 而 产生 非 确定 型 计算 的 深度 优先 分 析 。 

设 M=(Q,,T,6,go,F) 是 一 个 空间 边界 为 s(n) 的 双 带 图 灵机 。 输 入 为 w M 的 计算 形式 如 下 : 

qo: . BwB,. BB 

Eq; Bu.vB, x. y 

a; Bulv B, x... 
如 果 从 机 器 配置 % :Buw'. v'B, x y' 没 有 转换 且 q 不 是 接收 状态 ,或 者 所 有 可 运行 的 转换 都 已 经 检查 
完毕 ， 那 么 计算 必须 回 到 q: Bu. vB, x. y 以 尝试 备用 的 转换 。 一 个 机 器 配置 栈 提供 了 测试 所 有 备用 计 
算 所 需要 的 后 进 先 出 策略 。 为 了 判断 这 个 策略 的 时 间 复 杂 性 ， 我 们 必须 回答 两 个 问题 : “表示 机 器 配 
置 需要 多 少 空间 ?” 和 “可 能 存储 的 配置 的 最 大 数量 是 多 少 ?”。 

一 个 空间 边界 为 s(n) 的 双 带 图 灵机 的 配置 表示 需要 对 所 有 的 机 器 状态 、 只 读 带 的 带头 位 置 、 工 
作 带 的 带头 位 置 以 及 工作 带 的 前 s(n) 个 带 方 格 进行 编码 。 对 于 每 个 长 度 为 n 的 输入 ,状态 所 需要 
| log, (card( Q) ) | 个 格 ， 输入 带 带 头 位 置 所 需要 | log, (n +2) | 个 格 ， 工 作 带 带头 位 置 需要 个 [log, s(n) | 
格 ， 工 作 带 需要 s(n) 个 格 。 因 此 整个 配置 可 以 在 O(s(n)) 空 间 内 被 编码 。 

第 二 个 问题 的 答案 说 明 这 种 把 非 确定 型 机 器 转换 为 确定 型 机 器 的 直接 方法 不 会 产生 期 望 的 确定 型 
机 器 的 空间 复杂 性 。 根 据 定 理 17. 3.2, 需要 存储 在 栈 中 的 配置 的 数量 随 s(n) 指 数 级 地 增长 。 因 此 我 
们 需要 其 他 方法 。 

重要 发 现 ， 即 高 效 复 用 空间 是 一 个 有 大 次 转换 的 计算 

qo: .BwB.. BB 
: E-q; Bu. vB, x. y, 
可 以 被 分 裂 成 两 个 计算 
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qo: BwB,. BB 
Hq; Bu'.v'B, x'. y 
HFa Bu. vB, x. y, 
每 个 计算 均 包含 KV2 次 转换 ， 如 果 顺 序 地 执行 这 两 个 计算 ， 那 么 第 一 个 计算 使 用 的 空间 可 以 被 第 二 个 
计算 使 用 。 
我 们 使 用 这 种 存储 复 用 策略 来 判断 是 否 一 个 字符 串 w 被 空间 边界 为 s(n) 的 双 带 非 确定 型 图 灵机 
M = (Q, X,D,0,9,,F) £l, 设 cf he cf, 是 w tet EB, 所 有 可 能 的 机 器 配置 的 列表 ， 其 中 cf, 
是 初始 配置 qo: . BWB, . BB 的 编码 。 空 间 边界 s(n) 保 证 了 配置 的 数量 是 有 限 的 (定理 17.3.2) 。 
”算法 使 用 分 治 法 来 判断 一 个 配置 cf, 是否 是 通过 上 或 更 少 次 转换 从 配置 cf, 得 到 的 。 为 了 回答 这 个 
问题 ,我 们 只 需 找到 一 个 配置 of; ， 使 得 
1. 在 k/2 或 更 少 次 转换 内 cf, F- cf. B. 
2. 在 k/2 或 更 少 次 转换 内 cf F of, 
类 似 地 ， 为 了 发 现 是 否 在 k/2 或 更 少 次 转换 内 有 cf, 上 df; ， 我 们 只 需 找到 一 个 配置 of， 使 得 
1. 在 Kk/4 或 更 少 次 转换 内 cf F^ of, H 
2. 在 k/4 或 更 少 次 转换 内 cf H cf, o 
算法 17. 4. 4 中 的 Derive 过 程 使 用 递归 来 执行 这 个 搜索 。 图 17-3 给 出 了 与 调用 Derive (cf, ef, ,有 
相关 的 递归 树 。 节 点 [ms, 中 表示 一 个 判断 cf, 是 否 是 由 cfi 推导 而 来 的 调用 。 如 图 17-3 所 示 ， 
Derive( cf, ,cf, ,kK) 的 评估 最 多 有 [1log,(k) | 次 嵌 套 的 递归 。 现 在 我 们 可 以 用 以 上 的 发 现 来 为 接收 非 确定 
型 机 器 定义 的 语言 的 确定 型 算法 生成 一 个 空间 边界 。 


计算 大 小 
[1,2] 
[1,3] [3,2] k/2 
[1,4] [4,3] [3,5] [5,2] k/4 


Lak is iioc ee V 


[1,6] [64] [47] [5,3] [3,8] [8,5] [5,9] [9,2] k/8 


[1,(k/2) +2] 1 
图 17-3 Derive( cf, , cf, ,上 k) 的 递归 树 


定理 17.4.2 (FAT (Savitch) E) — 3 M 是 一 个 双 带 非 确定 型 图 灵机 ， 其 空间 边界 为 s(n)。 
那么 L(M) 可 以 被 空间 边界 为 O(s(n) ) 的 确定 型 图 灵机 接收 。 

证 明 : 算法 17.4.4 描述 了 字符 串 w 的 推导 的 递归 查找 。 根 据 推论 17.3.3; 每 一 个 weL(M) 都 能 
被 一 个 转换 次 数 不 超过 c" 的 计算 接收 。 我 们 顺序 地 检查 机 器 配置 ， 并且 对 于 每 个 M 的 接收 配置 都 在 
步骤 3. 2 中 调用 递归 查找 过 程 Derive。 该 调用 的 参数 是 M 的 初始 配置 ， 一 个 接收 配置 和 转换 边界 
c", MRES Derive 调用 发 现 了 一 个 推导 ， 那 么 算法 停止 并 接收 该 字符 串 。 如 果 所 有 的 调用 都 失 
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Wr, 那么 w 是 不 可 推导 的 并 且 字 符 串 被 拒绝 。 

接 下 来 我 们 要 判断 该 方法 需要 的 存储 数量 。 在 一 个 递归 调用 中 ， 调 用 过 程 Derive 存储 一 个 包含 了 
它 的 变量 值 和 局 部 变量 在 内 的 活动 记录 (activation record) 。 当 调用 结束 时 ， 活 动 记录 可 用 于 重新 存储 
值 。Derive 的 活动 记录 包括 两 个 机 器 配置 和 表示 转换 边界 的 整数 。 

一 个 实现 该 算法 的 图 灵机 必须 在 带 上 存储 活动 记录 。 如 前 所 述 ， 一 个 机 器 配置 只 需要 0(s(z) ) 个 
带 方 格 ， 因 此 活动 记录 所 需要 的 空间 也 是 0(s(z) ) 。 嵌 套 调 用 的 最 大 次 数 是 

[logi (c?) ] =[ s(n)log,(c) 1 e O(s(n)). 

PORE, O( s(n) ) 个 活动 记录 的 总 空间 是 O(s(n)”)。 L| 

定理 17. 4. 2 中 的 空间 复杂 性 边界 可 用 于 说 明了 -空间 = NP 了- 空间 。 

推论 17.4.3 妃 果 工 在 N- 空 间 ， 那 么 工 在 中- 空间 

证 明 : 如 果 工 在 NP- 空 间 ， 那么 L 可 以 被 多 项 式 空间 边界 p(n) 的 非 确定 型 图 灵机 接收 。 根 据 定 
38 17.4.2, 工 可 以 被 多 项 式 空间 边界 OCp(n)^ ) 的 确定 型 图 灵机 接收 。 因 此 工 在 人 了 -空间 。 L| 


算法 17.4.4 
非 确 定型 图 灵机 的 递归 模拟 
输入 : 图 灵机 M=(Q, ZŁ, T, 9, g, F) 
字符 串 w_ ez” 
M 的 配置 cf ，ch 3 css d, 
常量 c-3-card(Q) + card(T) 
空间 边界 s(n) 
1. found = false 
2-1] 
3. while not found and i « p do (检查 所 有 的 接收 配置 ) 


3.1.1: sil 


3.2. cf, Æ M 的 一 个 接收 配置 P -Space 
then found = Derive (cf, , cf,, c^") 
end while ' 
4. if found then 接收 else 拒绝 (9) 


Derive( cfs, cfe, k); 
begin 
Derive = false 
if k =0 and cfs = cfe then Derive = true 
if k 2 1 and cfs | cfe then Derive = true 
if k>1 then do 
t=] 
while not Derive and i « p do (检查 所 有 中 间 配 置 ) 
i; =i+1 
Derive = Derive( cfs, cf,, [ /2])) and Derive(cf,, cfe,| k/2])) 
end while 
end if 
end. 


图 17-4 -空间 与 其 他 复杂 性 类 的 关系 
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图 17-4 说 明了 了 -空间 与 其 他 复杂 性 类 的 关系 。 了 -空间 = NP 和 了 -空间 = 中 是 否 成 立 仍然 是 未 
知 的 。 然 而 ， 我 们 相信 图 17-4 的 所 有 结论 是 合适 的 。 


17.5 中 空间 完全 性 


我 们 引入 了 了 -空间 完全 性 的 表示 来 描述 了 -空间 类 的 二 般 性 问题 ， 并 提供 一 种 判断 思 C 了 -空间 和 
NP C NF- 空间 中 哪个 结论 是 等 式 (如 果 有 的 话 ) 的 方法 。 

定义 17.5.1 我 们 把 一 个 语言 Q 巴 做 ?- 空 间 难 的 (P - space hard), ， 如 果 对 于 每 个 Le PP- 空间 ， 
五 都 可 以 在 多 项 式 时 间 归 约 到 Q。 一 个 在 人 -空间 内 的 人 -空间 难 的 语言 叫做 -空间 完全 的 ( P-space 
complete) 。 : 

注意 了 -空间 完全 性 定义 中 的 归 约 有 多 项 式 的 时 间 ， 而 不 是 空间 约束 。 这 个 要 求 保 证 了 发 现 中 - 空 
间 完 全 问题 的 多 项 式 时 间 解 蕴含 人 -空间 = 了 。 

定理 17.5.2 设 Q 是 人 -空间 完全 的 语言 ， 那 么 

i) 如 果 Q 在 于 内 ;那么 中 = 空间 = 

i) 如 果 Q 在 NP 内 ， 那 么 ?空间 = NP, 

我 们 可 以 根据 所 有 在 了 -空间 内 的 语言 到 -空间 完全 语言 的 可 归 约 性 ， 以 及 我 们 所 熟悉 的 通过 顺 
序 执行 两 个 多 项 式 时 间 边 界 的 机 器 获取 多 项 式 时 间 边 界 的 过 程 ， 来 证 明定 理 17.5. 2。 定 理 17.5.2 说 
明 ， 找 到 一 个 不 在 了 或 N 了 内 的 了 -空间 完全 语言 就 能 够 回答 这 些 类 是 否 在 人 了 -空间 内 的 问题 。 

本 节 的 后 续 部 分 主要 用 于 说 明 下 面 定 义 的 判定 问题 是 了 -空间 完全 的 。 

输入 : 字母 表 卫 上 的 正则 表达 式 a 

输出 : 是 ; 如 果 az 于” 

T; 否则 

为 了 证 明 这 个 问题 是 了 -空间 完全 的 ， 我 们 需要 两 个 步骤。 首先 ， 我 们 必须 为 正则 表达 式 和 在 多 
项 式 空间 内 解决 该 问题 的 图 灵机 设计 一 个 字符 串 表 示 。 也 就 征 说 ， 图 灵机 接收 一 个 字符 串 ， 当 且 仅 当 
它 是 这 样 一 个 正则 表达 式 ， 其 语言 不 包括 其 字母 表 上 的 所 有 字符 串 。 这 个 步骤 可 以 在 字符 串 接 收 的 层 
次 完成 ， 我 们 把 它 留 作 练习 。 如 果 一 个 语言 包括 了 不 能 描述 所 有 字符 串 的 正则 表达 式 ， 那 么 我 们 把 它 
记 做 Lygoo 

第 二 个 步 又 要 说 明了 -空间 中 的 所 有 语言 都 能 在 多 项 式 时 间 归 约 到 Lsso。 该 证 明 需 要 使 用 到 那些 
在 可 满足 性 问题 N 了 完全 性 证 明 中 使 用 的 策略 。 为 了 说 明 了 -空间 的 语言 L 能 够 归 约 到 Le, RIE 
Be L 的 空间 边界 的 图 灵机 M. 的 计算 转换 成 正则 表达 式 。 对 于 每 个 we Ln, RIENE 
Ra, 使 得 M 接收 w， 当 且 仅 当 a, 不 包括 其 字母 表 上 的 所 有 字符 串 。 

设 M=(Q;v,Tw;6,45,F) 是 一 个 空间 边界 为 s(n) 的 单 带 确定 型 图 灵机 。 我 们 给 M 的 字母 表 添 
加 下 表 以 便 把 它 与 正则 表达 式 的 字母 表 区 分 开 来 。 我 们 将 根据 M A w 来 构造 正则 表达 式 。 在 不 损失 
一 般 性 的 前 提 下 ， 我 们 假设 没有 始 于 M 的 接收 状态 的 转移 。 

首先 ， 我 们 定义 一 个 字母 表层 ， 该 字母 表 人 允许 我 们 把 M 的 计算 表示 成 了 上 的 字符 串 。 字 母 表 对 于 
f q, €Q 和 aeTw 都 包含 [q;,a] 和 [ * ,a] 形 式 的 有 序 对 。 除 了 有 序 对 ， 了 还 包含 字符 上 。 直 观 上 ，- 一 
个 有 序 对 [ gq;,a] 表 示 正 被 带头 扫描 的 包含 字符 a 的 带 上 的 位 置 。[ * ,a] 中 第 一 个 位 置 上 的 星 号 表示 带头 
不 扫描 该 字符 。 我 们 可 以 用 s(n) 的 序列 来 表示 输入 长 度 为 n 时 机 器 M 计算 的 任何 一 个 机 器 配置 。 

下 列 字符 串 表示 输入 为 w =ai ,. .. ,a, 时 M 的 初始 配置 : 

[4 Bll *,a,][ *,ay)...0 * Soy) [ * By", 

其 中 的 指数 代表 [ * BIA s(n) -n-1 个 拷贝 的 连接 。 输 入 后 额外 的 空白 生成 s(n) 个 带 方 格 。 这 是 一 
个 计算 所 要 求 的 空间 上 界 。 我 们 将 表示 每 个 正好 有 s(n) 个 字符 的 配置 。M 的 计算 的 表示 包括 用 符号 
上 分 开 的 机 器 配置 序列 。 

现在 ,我 们 设计 一 个 正则 表达 式 a,， 使 其 包含 玉 上 所 有 不 在 接收 w 的 计算 中 出 现 的 字符 囊 。 如 
果 我 们 成 功 地 构造 出 这 样 一 个 表达 式 ， 
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a, X "MBs Bal w B] M 的 计算 
%4 H4 weL(M) 
MAM4 wel 
因此 ， 一 个 判定 Lnso 的 算法 能 够 用 于 判定 字符 串 w EBEL a, 的 构造 利用 了 M 的 计算 的 空 
间 边 界 。 
一 个 卫 上 的 表示 接收 w 的 计算 的 字符 串 必须 满足 下 面 三 个 条 件 : 
1. 输入 为 w 时， 前 s(n) 个 字符 必须 表示 M 的 初始 配置 。 
2. 符号 上 分 隔 配置 ， 并 且 每 个 配置 必须 跟随 M 发 生 转 换 前 的 前 驱 配 置 。 
3. 最 后 的 配置 必须 是 一 个 接收 状态 。 
对 于 以 上 的 每 个 条 件 ， 我 们 构造 一 个 正则 表达 式 使 其 包含 瑟 上 的 不 满足 该 条 件 的 字符 串 。 这 些 表 
达 式 的 并 定义 了 一 个 字符 串 集 合 ， 这 些 字 符 串 不 是 输入 w 时 M 的 接收 计算 的 表示 。 
如 果 一 个 字符 串 的 第 一 个 字符 不 是 [go,B] ,或 者 它 的 第 一 个 字符 与 [qo;B] 匹 配 但 是 第 二 字符 不 
Bl * ,a ] ,或 者 它 的 前 两 个 字符 匹配 但 是 第 三 个 字符 不 是 [ * ,a,]， 依 此 类 推 ， 那么 该 字符 串 不 满足 
第 一 个 条 件 。 恰 好 s(n) 个 上 述 形式 的 语句 描述 了 不 匹配 初始 配置 的 字符 串 。 该 正则 表达 式 的 语言 
e, 2(X-1[4,8]]) E" 
Ula BICE = HEF jaj] piae 
Ulag ,B][ * 4] CX =H *,a,]1) X' 


UL[Lgo,B]L * ,a,][ * d, ]-*-[ *,a, 4] X - 1L *,a,]]) E" 
U[qs,B]L * al * sa Jei ,aall* a,])(Qx-1L* ,B py 








Ulga BIE +a 1E * m1 *,aa1L*,2,1 L8] CX -TE*,81D X7 
生成 这 些 字 符 串 。 符 号 ( 工 -A) 是 一 个 缩写 ， 它 表示 删除 了 A 中 的 元 素 后 的 字母 表 的 子 集 。 

正则 表达 式 

os=(Z-| Lg;,a] laeTu,q; €Fl)* 

生成 了 不 包含 接收 状态 的 字符 的 所 有 字符 串 。 

第 二 个 条 件 要 求 成 功 的 配置 可 以 表示 为 M 的 一 个 转换 。 由 于 每 个 机 器 配置 都 正好 有 s(n) 个 符号 ， 
所 以 我 们 可 以 构造 一 个 正则 表达 式 % ， 使 得 a, 中 带 上 s(n) +1 位 置 部 分 的 符号 与 转换 的 结果 不 一 致 。 
描述 向 右 移动 的 转换 8( qi,a) =[5,q;,R] 生 成 一 个 下 列 形式 的 子 字 符 串 : 

x] Ca] x] FL x] * 6109.2], 

其 中 [gq,,a] 和 [ * ,中 被 (Cn) 个 符号 分 隔 开 。 

对 于 每 个 转换 8(q,,a) = [0,g,R]， 正 则 表达 式 


Us tanali x) CE CE - Lg) Z UD - DL 8) 27) 


AE LR E AER 5g ER D RC Fn], XP XA SA LIO SEE E PUE Lais a] [ * ,xz]， 并 且 在 后 面 的 
s(n) +1 个 位 置 上 是 除了 [ * ,b][4,,x] 以 外 的 字符 。 因 此 ， 一 个 满足 这 个 条 件 的 字符 串 不 是 M 的 计算 
的 表示 。 类 似 地 ， 我 们 可 以 从 描述 了 向 左 移动 的 转换 中 获取 正则 表达 式 。 正 则 表达 式 os 是 每 个 转换 
的 表达 式 的 并 。 

从 空间 边界 的 标准 图 灵机 到 正则 表达 式 的 转换 可 以 说 明 Liee 是 ?- 空 间 完全 的 。 设 工 是 了 -空间 中 
的 语言 。 那 么 工 可 以 被 多 项 式 空间 边界 p(n) 的 标准 图 灵机 接收 ， 并 且 该 图 灵机 没有 始 于 接收 状态 的 
转换 (练习 10)。 对 于 每 个 长 度 为 n 的 字符 串 w， 我 们 必须 说 明 结 果 正 则 表达 式 的 大 小 随 nn 多项式 地 
增长 。 正 则 表达 式 m 是 p(n) 子 表达 式 的 并 ,每 一 个 的 大 小 都 是 O(p(n)). e, 中 的 子 表达 式 也 是 
0(p(n) ) 的 ， 并且 子 表达 式 的 数量 与 输入 的 长 度 无 关 。 最 后 ，@s 的 大 小 是 一 个 由 M 的 状态 和 带 字符 
数 决 定 的 常量 。 因 此 a=, Ua, Ua 的 长 度 随 输入 w 的 长 度 多 项 式 地 增长 。 上 述 证 明说 明 , Lee HE 
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了 -空间 类 难 。 综 合 这 个 结论 和 Lso 成 员 资格 问题 的 多 项 式 空间 判定 过 程 ， 我 们 可 以 得 到 结论 

定理 17.5.3 语言 Lkgo 是 -空间 完全 的 。 

由 于 NP 和 -空间 的 包含 关系 ， 所 以 每 个 了 -空间 完全 问题 也 是 NP- 难 的 。 因 此 L 是 一 个 不 
存在 已 知 的 非 确定 的 多 项 式 时 间 解 的 NP- 难 问题 的 例子 。 


17.6 一 个 难 解 问题 


NN 了 -完全 问题 重要 性 的 一 个 度量 是 在 不 同 的 问题 领域 和 应 用 中 遇 到 它们 的 频率 。 即 使 不 存在 已 
知 的 能 够 解决 这 些 问 题 的 多 项 式 时 间 算法 ， 我 们 也 不 能 得 出 它们 不 在 了 内 的 结论 。 一 般 来 说 ， 证 明 一 
个 语言 或 问题 在 一 个 复杂 性 类 中 比 证 明 它 不 在 一 个 类 中 更 容易 实现 。 我 们 可 以 使 用 “猜想 和 检查 ” 策 
略 说 明 可 满足 性 问题 ， 哈 密 尔 顿 回路 问题 和 顶点 覆盖 问题 在 NP 内 时 都 比较 简单 。 到 目前 为 止 ， 没有 
人 能 证 明 任何 一 个 这 样 的 问题 不 在 类 了 中。 

难度 不 同 的 原因 在 于 生成 一 个 足够 说 明 问 题 在 了 P、NP 还 是 PP- 空间 类 中 的 算法 。 证 明 一 个 问题 
不 在 这 些 类 中 需要 为 所 有 人 解决 这 些 问题 的 算法 生成 一 个 更 小 边界 的 时 间或 空间 复杂 性 。 本 节 我 们 将 会 
看 到 识别 Lese 问 题 的 一 个 变种 是 难 解 的 ， 也 就 是 说 这 是 在 中 外 的 证 明 。 事 实 上 ， 我 们 会 说 明 它 在 中 - 
空间 类 之 外 ， 因 此 不 在 了 ?或 N? 中 。 

第 2 章 介绍 了 通过 给 正则 表达 式 的 标准 定义 再 增加 一 个 构造 就 可 以 得 到 带 平方 的 正则 表达 式 族 。 
字母 表 忆 上 带 平方 的 正则 表达 式 是 通过 对 于 每 个 ae CHA, O 和 a 递归 定义 的 。 如 果 w Ay BS EA 
平方 的 正则 表达 式 ， 那 么 (wUy) (uv) Qu" ) 和 (ww) 也 是 于 上 带 平方 的 正则 表达 式 。 像 前 面 一 样 ， 我 
们 使 用 关联 和 操作 符 优 先 来 减少 圆 括 号 的 数量 。 

由 于 表达 式 u^ 与 uu 表示 同样 的 语言 ， 所 以 平方 的 增加 不 会 增加 能 够 用 正则 表达 式 表示 的 语言 。 
但 是 ， 平 方 操作 符 减 少 了 描述 一 个 语言 的 表达 式 的 长 度 。 平 方 操作 符 允 许 我 们 用 O(n) 个 字符 把 一 个 
正则 表达 式 的 2" 个 拷贝 的 连接 写 做 

RWD 
其 中 使 用 了 nn 次 平方 操作 符 。 由 于 复杂 性 把 输入 和 时 间 及 空间 关联 起 来 了 ， 所 以 复杂 性 度量 的 增加 会 
导致 一 个 更 加 紧凑 的 输入 表示 。 

我 们 将 说 明 判 定 一 个 带 平 方 的 正则 表达 式 的 语言 是 否 不 包含 字母 表 上 所 有 的 字符 串 问题 不 在 P- 
空间 内 。 这 与 前 一 节 考 虑 的 问题 相同 ， 而 惟一 的 不 同 是 平方 操作 符 出 现在 正则 表达 式 中 。 后 续 部 分 介 
绍 了 该 问题 的 证 明 ， 该 证 明 中 把 图 灵机 计算 表示 成 了 带 平方 的 正则 表达 式 。 

设 工 是 一 个 能 被 空间 边界 为 2" 的 图 灵机 接收 的 语言 ， 且 L 不 能 被 空间 边界 为 2” 的 图 灵机 接收 。 
定理 17.5.3 保证 了 存在 这 样 一 种 语言 。 设 M 是 一 个 接收 工 且 空间 复杂 性 scu (n) =2" 的 单 带 确定 型 图 
灵机 。 像 前 面 一 样 ，M 的 计算 可 以 表示 成 字母 表 了 = | (9g,,a),[ *,a], Hlg eQ aeri EWEN 
达 式 。 对 于 每 个 了 vw“ 中 的 w=a,... ,a,， 我 们 定义 一 个 正则 表达 式 w, ,使 其 语言 是 不 在 M 接收 w 的 
计算 中 出 现 的 字符 串 。a, 构造 使 用 的 方法 同 17. 5 节 ， 但 是 我 们 使 用 平方 来 保证 a, 的 长 度 随 w 的 长 
度 线性 地 增长 。 

在 17.5 节 中 ,每 一 个 在 a, 中 编码 的 机 器 配置 都 有 s(n) 个 带 方 格 ， 其 中 s(n) 是 机 器 M 的 空间 边 
界 。 为 了 数字 操作 的 方便 ， 我 们 在 这 里 选择 带 位 置 2" + 元 +1。 输 入 为 由 时， 表示 M 的 计算 的 初始 配 
置 的 字符 串 包 括 ; 

[4.,B)[ * ,a,][ * a]: [ * ,a,] 
随后 是 [ * ,B] 的 2" 个 拷贝 。 平 方 操作 符 使 我 们 能 够 用 一 个 长 度 为 On) 的 正则 表达 式 描述 这 个 字符 
串 。 通 过 检查 ,我 们 可 以 看 到 当 我 们 用 平方 来 表示 [ * BAL POTERE, TB a. a, Flo, 只 
需要 大 小 为 O(z) 的 空间 。 因 此 ，a。 HKEE Ol). 

Wt Lrgos 表 示 正 则 表达 式 集合 ， 其 元 素 使 得 a s Y IFA a, 的 带 平方 的 形式 。 

定理 17.6.1 语言 Lreos 是 难 解 的 。 

WEBB: 假设 Lrsos 的 成 员 资 格 问题 可 以 由 一 个 多 项 式 空间 边界 的 图 灵机 M' 判 定 。 结合 a 的 构造 和 
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M' 的 计算 可 生成 如 下 操作 序列 : 

1. HA: 一 个 长 度 为 n WERE we Zw 

2. 转移 : 正则 表达 式 a, 的 构造 

3. M' 的 计算 : 判定 是 否 a, AD 

4. 结果 : wel 当 且 仅 当 M' 接 收 @,。 

整个 过 程 可 以 在 多 项 式 空间 内 完成 并 且 接收 语言 [(M) 。 由 于 工 (M) 不 能 被 任何 空间 复杂 性 小 于 
2 喧 的 图 灵机 接收 ， 所 以 这 是 一 个 矛盾 。 E 

语言 Laew 显 然 是 可 判定 的 。 一 个 简单 的 策略 是 扩展 a 中 平方 的 出 现 来 为 同一 个 语言 生成 一 个 标 
准 正则 表达 式 。 根 据 练习 13 ， 结 果 表 达 式 的 问题 可 以 在 长 度 的 多 项 式 空间 内 得 到 回答 。 不 幸 地 是 ， 后 
一 种 表达 式 的 空间 可 能 随 着 w 的 长 度 指数 级 地 增长 。 


17.7 练习 


1. i Q 是 可 以 在 多 项 式 时 间 内 归 约 到 语言 工 的 语言 。 请 证 明 Q 在 多 项 式 时 间 内 可 以 归 约 到 工 。。 
2. 设计 一 个 空间 复杂 性 为 Q(log,(n) ) 的 双 带 图 灵机 ， 使 之 能 够 接收 |a 2 [i0] 。 
3. 设 工 是 一 个 可 以 被 图 灵机 M 接收 的 语言 ， 且 输入 长 度 为 n 时 M 的 计算 最 多 需要 大 小 为 s(n) 的 空间 。 注 
意 我 们 不 要 求 M 的 所 有 计算 都 能 终止 。 请 证 明 工 是 递归 的 。 
4. 说 明 叶 -空间 对 于 并 和 补 是 封闭 的 。 
5. 给 下 列 每 个 空间 边界 设计 一 个 图 灵机 ， 说 明 该 函数 是 完全 空间 可 构造 的 。 
a) s(n) 2n 
b) s(n) =3n 
c) s(n) =n 
d) s(n) =2" 
6. it M 是 空间 复杂 性 scy(n) =f(n) 2n 的 图 灵机 。 请 注意 这 表示 存在 某 个 长 度 为 n 的 输入 使 得 M 正好 使 
用 scu (nn) 个 带 方 格 。 说 明了 (nn) 是 完全 空间 可 构造 的 。 
“7. 设计 一 个 输入 字母 表 为 11} 的 单 带 确定 型 图 灵机 ， 使 其 在 处 理 长 度 n>1 的 输入 时 正好 使 用 2" 个 带 方 格 。 
8. 设 s(n) 是 完全 空间 可 构造 的 函数 ，s(n) Sn A s(0) >0。 说明 存 在 对 任意 长 度 为 的 输入 都 正好 使 用 
s(n) 个 带 方 格 的 单 带 图 灵机 。 
9. KM 是 一 个 s(n) 边界 的 图 灵机 且 s(n) 宇 n。 证 明 存 在 一 个 接收 L(M) 的 s(n) 边界 的 单 带 图 灵机 。 
10. 设 工 是 一 个 和 空间 中 的 语言 。 证 明 存 在 一 个 没有 始 于 接收 状态 的 转移 的 单 带 图 灵机 ， 该 图 灵机 接收 L 
并 且 其 计算 有 多 项 式 空间 边界 。 
11. 请 证 明 能 被 s(n) = log, (m) 空 间 边 界 图 灵机 接收 的 语言 集合 是 能 被 s(n) =n 空间 边界 图 灵机 接收 的 语言 
集合 的 子 集 。 
“12. AER s(n) =n 空间 边界 图 灵机 接收 的 语言 集合 是 否 是 s(n) -2n' 空间 边界 图 灵机 接收 的 语言 集合 的 子 
集 ? 请 证 明 你 的 结论 。 
13. 说 明 语言 Lngo 在 于 -空间 内 。 提 示 : 使 用 了 -空间 和 NP 了 P- 空间 的 等 价 ， 设 计 一 个 能 够 判定 Le 成员 资格 
问题 的 非 确定 型 多 项 式 空间 边界 的 图 灵机 。 
14. 请 证 明定 理 17. 5.2, 
15. 说 明 任 意 人 空间 完全 的 语言 都 是 入 JP- 难 的 。 


参考 文献 注释 


Ladner [1975] WEFAT REP ANP 成 立 ，N 了 PJ 语言 的 存在 性 。Karp [1972] 给 出 了 了 -空间 完全 性 
的 第 一 个 证 明 。 本 书 对 空间 复杂 性 介绍 是 按照 Hopcroft 和 Ullman [1979] 中 的 内 容 给 出 的 。 这 本 著作 和 
Papdimitriou [1994] 给 出 了 很 多 关于 空间 复杂 性 的 其 他 结果 。 判 定 扩展 正则 表达 式 语言 的 难 解 性 来 自 Mey- 
er 和 Stockmeyer [1973] 的 著作 。 
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第 五 部 分 
确定 型 语法 分 析 


程序 设计 语言 的 定义 和 程序 编译 将 形式 语言 理论 和 计算 机 科学 应 用 程序 直接 联系 起 来 。 程 序 的 纺 
译 是 一 个 多 步骤 的 过 程 ， 在 编译 的 过 程 中 ， 使 用 高 级 语言 书写 的 源 代码 经 过 分 析 和 转换 变 成 可 执行 的 
机 器 语言 代码 或 者 汇编 语言 代码 。 这 一 过 程 的 头 两 个 步骤 是 词法 分 析 (lexical analysis) 和 语法 分 析 
(parsing) ， 这 两 个 步骤 主要 用 于 检查 源 代 码 语法 的 正确 性 。 词 法 分 析 器 阅读 源 代 码 中 的 字符 ， 并 构造 
出 程序 设计 语言 的 符号 〈token) (保留 字 ， 标 识 符 ， 特 殊 符 号 等 ) 的 序列 。 然 后 ， 语 法 分 析 器 (par- 
ser) 判断 作为 结果 的 符号 串 是 否 能 够 满足 程序 设计 语言 定义 的 语法 要 求 。 

1960 年 ，ALGOL 60 诞生 ， 这 是 第 一 种 利用 文法 规则 来 对 语法 进行 形式 定义 的 程序 设计 语言 。 从 
此 ,文法 成 为 定义 程序 设计 语言 语法 的 主要 工具 。 附 录 亚 中 给 出 了 Java 程序 设计 语言 的 巴克 斯 -诺尔 
范式 (Backus-Naur form) 文法 ,该 文法 用 于 定义 一 个 在 语法 上 正确 的 Java 程序 构成 的 集合 。 但 是 ， 
如 何 判 断 某 个 Java 语言 的 源 代码 序列 是 否 构成 了 一 个 语法 正确 的 程序 呢 ? 如 果 源 代码 是 可 以 通过 使 用 
文法 规则 从 变量 (variable) 《编译 单位 》 推 导出 来 ， 那 么 相应 的 语法 就 是 正确 的 。 要 判断 使 用 Java iE 
言 或 者 其 他 使 用 上 下 文 无 关 文法 (context-free grammar) 定义 的 语言 所 书写 的 程序 在 语法 上 是 否 正确 ， 
就 必须 要 设计 语法 分 析 算 法 ， 该 算法 可 以 生成 一 种 文法 语言 的 推导 串 。 如 果 该 字符 串 不 在 相应 的 语言 
中 ,那么 这 些 程序 就 会 发 现 没有 相应 的 推导 存在 。 

第 18 章 将 会 演示 用 相应 算法 进行 语法 检查 (syntax checking) 的 可 行 性 。 同 时 ， 这 一 章 将 会 引信 
自 顶 向 下 语法 分 析 (top-down parsing) 和 自 底 向 上 语法 分 析 (bottom-up parsing) 两 种 方法 ， 这 两 种 
方法 均 是 通过 搜索 可 能 存在 的 推导 图 (graph of possible derivation) 来 进行 的 。 分 析 器 进行 穷 举 搜索 
(exhaustive search); 自 顶 向 下 分 析 器 检查 所 有 可 允许 的 规则 应 用 ， 而 自 底 向 上 分 析 器 则 进行 所 有 可 能 
的 归 约 〈reduction) 。 无 论 哪 种 情况 ， 这 些 算法 都 能 够 很 好 地 检测 很 多 无 关系 的 推导 。 虽 然 这 些 算法 
能 够 演示 其 语法 分 析 的 可 行 性 ， 但 它们 的 效率 低下 问题 使 得 它们 对 于 商用 编译 器 或 者 解释 器 来 说 都 是 
不 可 接收 的 。 

19 和 20 章 引入 了 两 类 上 下 文 无 关 文 法 ， 这 两 类 文法 使 得 语法 分 析 变 得 更 加 有 效 。 为 了 确保 所 选 
择 的 动作 是 合适 的 ， 分 析 器 “ 预 读 (look ahead) ”将 要 被 分 析 的 字符 串 。 如 果 在 每 一 个 步 又 中 都 有 至 
多 一 个 规则 可 以 成 功 地 扩展 当前 的 推导 ,那么 这 个 时 候 的 分 析 器 就 是 确定 型 的 。LL( 如 文法 允许 确定 
型 的 自 顶 向 下 分 析 器 预 读 个 符号 。 在 自 底 向 上 分 析 器 中 ，LR(k) 分 析 器 使 用 有 限 自动 机 ， 并 且 预 读 


k 个 符号 来 选择 归 约 或 者 移 进 shift) 。 当 代 大 多 数 程序 设计 语言 都 是 使 用 LL 文法 或 者 LR 文法 定义 


的 ， 也 有 使 用 这 两 种 文法 的 变种 来 定义 的 ， 从 而 使 得 分 析 更 加 有 效 。 贯 穿 整个 语法 分 析 的 介绍 中 , 我 
们 都 假定 文法 是 无 二 义 性 的 ， 这 对 于 用 来 定义 任何 程序 设计 语言 的 文法 来 说 都 是 合理 的 。 


第 18 章 语法 分 析 引 论 


本 章 将 引入 两 个 简单 的 分 析 算 法 ， 用 以 显示 自 顶 向 下 分 析 和 自 底 向 上 分 析 的 特性 。 这 些 算法 均 是 
基于 图 的 宽度 优先 搜索 (breadth-first search) 的 ， 图 中 的 路 径 代 表 了 文法 的 推导 。 分 析 器 的 输入 是 文 
法 字母 表 上 的 一 个 串 ， 如 果 该 串 属于 这 个 文法 所 定义 的 语言 ， 那 么 预期 结果 则 是 输出 该 输入 串 的 一 个 
推导 。 和 否则 ， 分 析 器 将 会 显示 无 法 推导 出 该 输入 串 。 

自 项 向 下 分 析 起 始 于 文法 的 开始 符号 (start symbol) ， 并 系统 地 应 用 相应 的 规则 以 尝试 产生 输入 
串 。 自 底 向 上 分 析 将 该 过 程 颠 倒 过 来 ; 它 起 始 于 输入 串 自身 ， 并 且 “ 逆 向 ”应 用 规则 ， 以 尝试 能 够 产 
生 开始 符号 。 这 些 简 单 的 算法 演示 了 用 于 语法 分 析 的 规则 形式 的 潜在 有 效 性 。 对 于 任意 一 种 语言 来 
说 ， 搜 索 可 能 不 会 终止 。 然 而 ， 使 用 格 立 巴赫 范式 的 文法 可 以 停止 自 顶 向 下 的 算法 ， 而 不 具有 链 规 则 
的 非 限 定 文法 则 足以 保证 能 够 停止 一 个 自 底 向 上 的 分 析 器 。 

用 于 定义 程序 设计 语言 的 文法 在 规则 的 问题 上 ， 要 求 一 些 附加 的 条 件 以 便 有 效 地 分 析 语言 串 。 为 
了 有 效 分 析 而 特别 设计 的 文法 将 会 在 第 19 章 和 第 20 章 中 介绍 。 


18.1 文法 图 


本 章 的 引 论 很 直观 ， 自 顶 向 下 分 析 被 描述 成 搜索 一 个 推导 图 。 因 为 任何 一 个 可 推导 的 终结 符 串 都 
具有 一 个 最 左 推导 〈 见 定理 3.5.1) ， 所 以 这 里 将 会 把 搜索 限制 在 最 左 推导 。 如 果 文 法 是 无 二 义 性 的 ， 
那么 这 种 推导 就 会 生成 一 棵 树 ， 这 棵 树 的 树 根 就 是 文法 的 开始 符号 。 这 里 需要 指出 一 点 ， 对 于 任何 一 
种 有 意义 的 文法 来 说 ， 都 将 会 有 无 限 多 种 推导 ， 而 且 图 中 会 有 无 限 多 个 节点 。 

定义 18.1.1 设 G=(V, 耻 ,P,S) 是 上 下 文 无 关 文 法 , 文法 G 的 图 g(G) 是 一 个 带 标 记 的 有 向 图 ， 
其 中 节点 和 弧 的 定义 如 下 : 

i) N2lwe(VuUX)'| S -»w| 

ii) A={[v,w,k] ENXNXN| v =w RJ KJ? 。 

图 中 的 节点 是 文法 的 左 名 型， 也 就 是 可 以 通过 最 左 推导 从 开始 符号 推导 出 来 的 串 。 在 g(G) 中 ， 
WR v 地 w， 也 就 是 说 如 果 w 可 以 利用 一 个 最 左 规则 应 用 从 v 处 获得 ， 则 串 w 邻接 于 v。 这 些 文法 规则 
被 依次 标 上 号 码 ， 这 些 号 码 用 于 标记 图 中 的 弧 线 以 及 后 来 的 语法 分 析 算 法 。 如 果 用 规则 的 应 用 来 创 
EM v 到 w 的 弧 线 ， 那 么 这 个 弧 线 就 被 上 所 标记 。 在 g(G) 中 ， 从 5 到 w 的 一 条 路 径 代 表 了 从 5 到 w 
的 一 个 最 左 推导 。 

文法 图 是 为 任意 一 种 上 下 文 无 关 文 法 定义 的 。 如 果 文 法 是 无 二 义 性 的 ， 那么 结果 图 就 是 一 棵 将 开 
始 符号 作为 根 的 树 。 因 为 可 以 进行 确定 型 语法 分 析 的 文法 是 无 二 义 性 的 ， 所 以 当 描述 语法 分 析 策 略 的 
时 候 ， 就 可 以 任意 使 用 树 的 术语 表 和 树 的 搜索 算法 。 这 里 特别 需要 指出 的 是 ，8g(G ) 被 称 为 文法 G 的 
推导 树 。 

在 g(G) 中 ,推导 用 路 径 来 表示 ， 那么， 判断 串 w 是 否 在 语言 G 中 这 个 问题 就 简单 地 转化 为 在 
(G) 中 寻找 一 条 从 8 到 w 的 路 径 。 图 18-1 阐明 了 如 何在 图 中 将 推导 表示 为 路 径 ， 该 图 使 用 了 文法 AE 
(加 法 表达 式 ) : 





O NxNxN 中 的 前 两 个 N 是 (i) 中 定义 的 节点 集合 N; 最 后 一 个 N 是 自然 数 集合 。 一 一 译 者 注 
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1. $—A 

2.A>T|A+T 

3.A-A+T 

4. Tb 

5. T—(A). 
AE 的 开始 符号 是 S$， 这 个 语言 包含 了 所 有 的 由 运算 符号 + 、 惟 一 的 运算 对 象 户 以 及 圆 括 号 构成 的 算数 
表达 式 。 由 AE 生成 的 串 包括 b\((b))、(b+5) 以 及 (b) + b 等 等 。 本 章 将 会 使 用 文法 AE 来 阐明 语法 
分 析 算 法 的 特性 。 














Level 0 1 2 3 E 5 
10 
y D A) 
4 2 
27 FT) 
T A A+ — (A+T. 
; (A) F (4+7) (A+T+T) 
Ps p. bb 
S : A b+T Fly 


(AHT ner 








3N enter 


4 


A+T+T T+T+T —b+T+T 





5 
(A)+T+T 


2 
A+T+T+T —— T+T+T+T 


3 ALETT HT HT 


图 18-1 AE 的 推导 树 


句 型 中 最 左边 的 变量 相应 的 规则 ( 即 以 该 变 元 为 左 部 的 规则 ) 个 数 决定 了 该 节点 的 子 节点 个 数 。 
任何 一 个 直接 递归 或 者 间接 递归 的 存在 都 会 在 树 中 产生 无 穷 多 的 节点 。 直 接 递归 规则 A 和 间接 递归 规 
则 了 工 的 反复 应 用 能 产生 图 18-1 中 的 树 的 任意 长 度 的 路 径 。 

标准 的 树 搜索 技术 可 以 用 于 检查 推导 树 中 的 推导 。 在 关于 树 搜索 的 术语 中 ,该 推导 树 被 称 为 隐 含 
树 (implicit tree) ， 这 是 因为 这 种 树 的 节点 并 不 是 搜索 前 构造 起 来 的 。 这 种 搜索 在 检查 路 径 时 构造 出 
推导 树 。 这 种 算法 的 一 个 重要 特征 就 是 要 显 式 地 构造 尽 可 能 少 的 隐 含 树 。 


18.2 自 项 向 下 语法 分 析 


文法 推导 树 中 的 路 径 代 表 了 文法 的 最 左 推导 。 这 里 的 自 项 向 下 语法 分 析 算 法 使 用 了 宽度 优先 策略 
来 搜索 隐 含 树 中 的 输出 串 的 推导 。 如 果 发 现 了 串 的 一 个 推导 ， 则 算法 接收 该 输入 ;如 果 语 法 分 析 器 确 
定 没有 相应 的 推导 ， 则 算法 拒绝 该 输入 。 

为 了 限制 所 需要 的 搜索 数量 ， 语 法 分 析 器 使 用 前 绥 匹 配 来 确定 不 能 出 现在 输出 串 推导 中 的 名 型。 
串 的 终结 前 缓 〈terminal prefix) 是 出 现在 最 左 变量 前 边 的 子 串 。 也 就 是 说 ， 如 果 B 是 串 中 第 一 个 变 
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量 , 那么 x 就 是 xBy 的 终结 前 绥 。 若 串 xBy 的 终结 前 级 x 不 能 与 输入 串 的 前 级 相 匹 配 ， 则 输入 串 不 能 
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从 xBy 推导 出 来 。 这 样 的 串 xBy 被 成 为 死 端 (dead end) ， 并 且 搜 索 时 要 忽略 其 后 代 。 

语法 分 析 器 构造 出 一 棵 搜索 树 T， 指 针 从 子 节点 指向 其 父 节点 〈 父 指针 ) 。 搜 索 树 是 隐 含 树 的 一 
部 分 ， 隐 含 树 在 语法 分 析 的 过 程 中 需要 进行 明确 的 检查 。 用 号 码 对 文法 规则 进行 标记 ， 节 点 的 子 节点 
则 会 根据 规则 的 排序 而 被 加 入 到 树 中 。 生 成 一 个 节点 的 后 继 的 过 程 ， 以 及 把 它们 加 入 到 搜索 树 中 则 被 
称 为 扩展 节点 (expanding the node) 。 

宽度 优先 树 搜索 需要 使 用 先进 先 出 的 内 存 管 理 策略 ， 这 里 使 用 队列 来 实现 这 一 策略 。 队 列 Q 的 维 
护 需 要 提供 三 个 函数 : INSERT(x,Q) 表 示 将 串 x 放 到 队列 的 尾部 ;REMOVE( Q) 返 回 队 首 的 元 素 ， 并 
将 其 从 队列 中 删除 ; EMPTY(Q) 是 一 个 布尔 函数 ， 如 果 队 列 为 空 ， 则 该 函数 返回 tue; 否则 ,返回 
false。 





算法 18.2.1 宽度 优先 自 项 向 下 语法 分 析 器 
NA: EP RAE Gav, E.P, S) 
FHP peL’ 
数据 结构 :队列 Q 
1. 用 根 S 初始 化 了 
INSERT (S, Q) 
2. repeat 
2.1.4: - REMOVE (Q) (要 扩展 的 节点 ) 
22i. (最 后 用 到 的 规则 的 序号 ) 
2. 3. done; = false (扩展 完成 的 布尔 型 标记 ) 
设 4=v ， 其 中 4 是 4 中 最 左边 的 变量 
2. 4. repeat 
2. 4. 1. if 没有 规则 序号 比 i 大 的 规则 A，then done : = true 
2. 4. 2. if not done then 
设 A—w 是 第 一 个 序号 比 i 大 的 规则 A， 且 设 j 是 该 规则 的 序号 
2.4.2. l. if uwv ¢ X ' Jf H. uwv 的 最 终 前 级 与 P 的 一 个 前 级 匹配 
2.4.2. 1. 1. INSERT (uwv, Q) 
2.4.2.1.2. 在 了 中 添加 节点 uw. 设置 一 个 从 uwv 到 q 的 指针 . 
end if ; 
end if 
2.4.3.i 2j 
until done or p = uwv 
until EMPTY (Q) or p = uwy 
3. if p = uwv then 接收 else 拒绝 


对 搜索 树 进行 初始 化 是 从 树 根 S 开始 的 ， 这 是 因为 自 顶 向 下 的 算法 尝试 找到 从 S FP 260958 A R p 
的 推导 。 这 个 算法 包括 两 个 舱 套 的 repeat - until 循环 。 外 部 循环 选择 队列 中 第 一 个 节点 4 以 便 进行 扩 
展 。 在 步骤 2.4 中 ， 内 部 循环 按照 规则 的 编号 方式 所 指定 的 序列 生成 节点 4 的 后 继 。 串 uAv 扩展 生成 
的 串 uwv 存在 三 种 可 能 性 : 它 可 能 是 一 个 终结 串 ， 可 能 是 一 个 死 端 , 或 者 可 能 是 一 个 需要 进一步 扩展 
的 句 型 。 

如 果 uwv 是 一 个 终结 串 ， 那 么 就 表示 该 推导 已 经 结束 了 ， 并 且 该 串 不 会 被 加 入 到 树 中 ， 也 不 会 被 
加 入 到 队列 里 。 语 句 until 则 检查 该 串 是 否 是 输入 串 。 如 果 是 的 话 ， 就 停止 计算 并 且 接 收 该 串 。 否 则 ， 
继续 生成 下 一 个 子 节点 以 对 uAw 进行 扩展 。 








A183 BEDI 327 





步骤 2.4. 2. 1 负责 检查 前 缀 匹配 。 如 果菜 个 串 是 死 端 ， 那么 该 串 将 不 会 被 加 入 到 队列 或 者 树 中 ， 
在 步骤 2. 4. 2. 1.1 和 步骤 2.4.2.1.1 中 ,满足 前 级 匹配 的 串 被 加 入 到 队列 和 树 中。 无 论 上 述 哪 种 情况 ， 
扩展 都 是 通过 生成 uAv 的 下 一 个 子 节点 来 进行 的 。 

节点 选择 的 周期 和 扩展 的 过 程 是 反复 进行 的 ， 除 非 生 成 了 输入 串 ， 或 者 队列 为 空 ， 否 则 这 个 过 程 
将 一 直 持 续 下 去 。 只 有 当 所 有 可 能 的 推导 均 被 检查 过 ， 并 且 没有 成 功 推导 出 输入 串 的 时 候 ， 后 面 那 种 
情况 才 会 出 现 。 队 列 所 维护 的 先进 先 出 顺序 生成 了 搜索 树 的 宽度 优先 结构 。 

图 18-1 给 出 了 文法 AE 的 推导 树 的 前 五 层 。 分 析 器 逐 层 评估 树 中 的 这 些 节点 。 图 18-2 给 出 了 分 析 
(b+5) 所 构造 的 搜索 树 。 这 里 用 点 线 来 表示 那些 已 经 生成 ,但 是 未 被 加 入 到 搜索 树 中 的 句 型 。 


0) 





二 和 = ((4)) 
- (b+7) —— (btb) 
S (T+) = (+r) 
~A) (A*T) Moin 
(A+T+T) — NH 
S r4 (A+T+T+T) 
b+T 
P he OT 
py 2 (PHT ei wads (4)*T 
A+T " 
(A+T)+T = (T+T)+T 
( 2 bATAT (4*T-T)*T 
At+T+T T+T+T (A)+T+T SOT 
(A+T)+T+T 
yc RE ET" 
A+T+T+T T+T+T+T (A)+T+T+T 





A+T+T+T+T SS 了 下 7 二 7 
A+ T+T+T+T+T 


图 18-2 (b+b) 的 自 顶 向 下 语法 分 析 。 


步 又 2.4. 2. 1 进行 了 比较 ， 该 比较 用 于 检查 语法 分 析 器 生成 ，_ ES O REANA 
的 句 型 的 终结 符 前 级 是 否 与 输入 捉 相 匹配 。 为 了 获取 匹配 所 需要 A à 
的 信息 ， 语 法 分 析 器 在 其 构造 推导 的 过 程 中 “ 读 取 ” 输 入 串 。 (4) 
语法 分 析 器 按 从 左 到 右 的 方式 扫描 输入 串 ， 一 直到 导出 句 型 的 最 。 一 (aer) 
SEE. SEAHEC ARDEA HEAR DLO Mh Atk. m D ( 
语法 分 析 咒 扫描 的 串 的 初始 段 和 导出 串 的 终结 符 前 级 之 间 存在 相 。 了 D AT 
应 的 关系 ，(b +b) 的 推导 可 以 展现 出 这 一 点 : 
语法 分 析 器 不 仅 要 能 生成 语言 串 的 推导 ， 还 要 具备 判定 该 串 不 在 此 语言 中 的 能 力 。 图 18-2 中 的 搜 
索 树 的 下 部 可 以 潜在 地 无 限 增长 。 规 则 AA + 了 的 直接 递归 可 以 构造 出 任何 以 一 个 或 者 多 个 以 + 了 为 
后 级 的 串 。 当 搜索 一 个 不 在 该 语言 中 的 串 的 推导 时 ， 直 接 递 归 规 则 A 永远 不 会 生成 可 以 终止 此 搜索 
HOE 
读者 可 能 存在 这 样 的 疑问 ， 串 4 + 7+ 了 是 不 能 推导 出 (5+ 0) 的 ， 并 且 该 串 不 能 声明 一 个 死 端 。 
两 个 + 的 存在 的 确 能 够 确保 没有 规则 序列 可 以 将 4+ 了 + 了 转换 成 (5+5) 。 然 而 ， 做 出 这 样 的 判断 需 
要 对 已 被 语法 分 析 器 扫描 过 的 初始 段 之 外 的 输入 串 有 所 了 解 。 第 19 章 中 的 语法 分 析 器 将 会 “ 预 读 ” 
串 ， 越 过 语法 分 析 器 生成 的 终结 前 缀 进行 扫描 ， 以 便于 帮助 选择 语法 分 析 器 将 要 进行 的 后 续 动 作 。 
对 于 进入 永 不 停止 的 计算 这 种 情况 来 说 ， 它 是 由 一 种 特殊 的 规则 的 存在 所 引起 的 ， 该 规则 的 应 用 
不 会 增加 终结 符 前 缀 的 长 度 。 一 种 “修改 ”算法 18. 2. 1 的 方法 是 只 使 用 不 允许 这 种 情况 发 生 的 文法 。 





[560] 
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在 第 4 章 中 ， 我 们 可 以 看 到 ， 任 何 一 种 上 下 文 无 关 的 语言 都 是 由 乔 姆 斯 基 范式 中 的 文法 生成 的 。 乔 姆 
斯 基 范 式 文 法 中 的 每 个 规则 的 应 用 ， 均 是 完成 下 面 这 两 件 事情 中 的 一 种 : 要 么 将 终结 符 加 到 导出 串 的 
前 级 上 ， 要么 完成 一 个 推导 。 这 就 保证 了 算法 18. 2. 1 对 于 任何 输入 串 都 会 停止 , 这 是 因为 外 在 搜索 
树 将 会 拥有 一 个 深度 ， 而 这 个 深度 受到 输入 串 的 长 度 的 限制 。 

对 于 为 语言 中 任何 一 个 串 构 造 推导 来 说 ， 使 用 宽度 优先 算法 都 将 是 会 成 功 的 ， 尽 管 如 此 ， 这 种 方 
法 的 实际 应 用 存在 很 多 缺点 。 完 长 的 推导 以 及 带 有 大 量规 则 的 文法 导致 了 搜索 树 的 大 小 增长 迅速 。 搜 
索 树 的 指数 速度 的 增长 并 未 受到 语法 分 析 算 法 的 限制 ， 但 却 是 宽度 优先 树 搜索 的 一 个 普遍 特性 。 如 果 
将 文法 设计 成 可 以 利用 前 缓 快速 匹配 的 情况 ， 或 者 可 以 改进 其 他 的 情况 以 找到 搜索 中 的 死 端 ， 那 么 这 
种 与 搜索 树 增长 问题 相关 联 的 组 合 问题 可 能 就 会 得 到 延缓 ， 但 是 这 种 问题 是 不 可 能 避免 的 。 所 以 , 我 
们 需要 更 好 的 策略 来 解决 这 一 问题 。 


18.3 ” 归 约 和 自 底 向 上 语法 分 析 


在 自 顶 向 下 分 析 中 ， 寻 找 一 个 推导 需要 从 开始 符号 检测 文法 推导 树 中 的 路 径 。 这 种 搜索 可 以 系统 
地 构造 推导 ， 直 到 找到 输入 字符 ， 或 者 ， 如 果 发 现 无 相应 的 推导 存在 ， 则 可 以 减少 此 输入 。 这 种 策略 
执行 的 是 一 种 穷 举 搜索 。 除 了 因为 死 端的 定义 而 导致 的 修剪 ， 每 个 输入 串 均 会 生成 相同 的 树 。 用 这 种 
方式 来 搜索 需要 检查 出 很 多 不 可 能 生成 输出 串 的 推导 。 例 如 ,图 18-2 中 ,以 A + 了 为 根 的 整个 子 树 包 
含 了 不 能 产生 (b+b) 的 推导 。 


自 底 向 上 分 析 会 构造 出 一 棵 根部 是 输入 串 p 的 搜索 树 ，” ”规则 应 用 归 约 
并 且 可 以 “逆向 ”使 用 规则 。 当 从 输入 串 开始 进行 搜索 的 时 “字符 虽 uv um 
候 ， 只 是 对 能 够 生成 的 推导 进行 检查 。 这 就 使 得 注意 力 集 PN A Aw 
中 在 搜索 上 ， 并 且 这 样 能 够 减少 搜索 树 的 大 小 。 WT RA 


含 图 的 大 小 ， 自 顶 向 下 语法 分 析 器 只 是 生成 了 最 左 推导 。 因 为 自 底 向 上 语法 分 析 器 逆向 构造 推导 ， 所 
以 只 要 检查 其 最 右 推导 即 可 。 自 底 向 上 语法 分 析 可 以 被 看 成 是 对 于 包含 所 有 从 p 开始 进行 最 右 推导 的 
串 的 隐 含 图 的 搜索 。 

与 构造 推导 相反 的 操作 ， 这 里 称 之 为 归 约 。 正 如 所 预料 的 那样 ， 规 则 应 用 和 归 约 具有 相反 关系 : 
归 约 利用 左边 的 单个 变量 来 代替 规则 的 右 部 。 就 像 归 约 这 个 名 字 所 暗示 的 那样 ， 归 约 的 目的 就 是 减少 
字符 串 的 长 度 ， 这 一 点 在 下 面 的 例子 中 会 加 以 阐明 。 

字符 串 abb aAbAbbab BAA 

规则 Aab AbAb AAA 

归 约 Ab aAAbab BA 
每 当 规 则 右 部 的 长 度 大 于 一 的 时 候 ， 归 约 就 生成 一 个 长 度 更 短 的 串 。 

在 某 些 情况 下 ， 必 须要 能 够 确保 搜索 只 是 检查 最 右 推导 ， 这 里 使 用 文法 AE T 
来 阐述 这 种 情况 。 考 虑 使 用 规则 Tb XE b + b 进行 归 约 的 情况 : 
这 棵 树 显示 了 推导 T+ bb +b Alb + Tob +b 的 情况 。 通 过 增加 5+T 和 T+6b 的 OP < 
所 有 归 约 来 构造 另外 一 层 ， 从 而 生成 了 下 面 这 棵 树 : vii 


这 里 需要 注意 的 是 ， 串 T+7T 出 现 了 两 次 ， 一 次 是 在 推导 了 + 了 一 A*b 
T+b>b+b 中 出 现 ， 另 外 一 次 是 在 了 + TSb * TSb +b 中 出 现 。 后 T+b 
面 的 这 个 推导 并 不 是 最 右 推导 ， 搜 索 不 应 该 考虑 相应 的 归 约 。 

只 有 当 串 没有 变量 的 时 候 ， 规 则 Aw 对 uw 产生 的 归 约 才 会 peb T+T 
生成 一 个 最 右 推 导 。 如 果 v 中 存在 一 个 变量 ， 则 相应 的 推导 uAv— 
uwv 就 不 是 最 右 推导 ， 这 是 因为 ”中 的 变量 发 生 在 4 的 右边 。 这 种 情 b+T 
况 合并 在 自 底 向 上 的 语法 分 析 器 中 ， 从 而 可 以 保证 最 右 推导 的 生成 。 b+A 
例 18. 3. 1 就 描述 了 从 归 约 序列 中 获得 最 右 推导 的 过 程 。 
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例 18.3.1 (b) +b 归 约 到 开始 符号 S 是 通过 使 用 文法 AE 的 规则 给 出 的 。 





使 用 规则 T—(A) fl AA +7 的 归 约 缩短 了 串 的 长 度 ， 并 且 Tb K — a aw 
终结 符 b 转换 成 变量 7T。 在 将 w 归纳 到 5 nume, EEA (b) +b 
生 最 右 推导 。 (T) +b T—b 
SA (A) +b AT 
T+b T-(A) 

=A+T A+b A—T 
>Å +b A+T T—b 
=>T+b A 4 一 4 +T 
一 (4) +b Eos 
=>(T) +b 
—(b) +b. 


因为 推导 的 构造 在 过 到 开始 符号 的 时 候 就 结束 了 ， 所 以 自 底 向 上 语法 分 析 器 经 常 逆向 构造 最 右 推导 。 
18.4 自 底 向 上 语法 分 析 器 


通过 自 底 向 上 语法 分 析 器 搜索 的 隐 含 图 是 由 文法 G = (V, X ,P,S) 和 输入 串 p 一 同 决定 的 。 图 中 
的 节点 表示 的 是 一 些 串 ， 这 些 串 可 以 通过 应 用 最 右 规则 推导 出 来 。 如 果 节 点 w 可 以 通过 应 用 某 个 最 右 
规则 而 从 v 处 获得 ， 那 么 节点 w 与 节点 v 邻接 。 

宽度 优先 自 底 向 上 语法 分 析 器 以 p 为 根 逐 层 构造 出 一 棵 搜索 树 。 和 自 顶 向 下 语法 分 析 器 一 样 ， 搜 
ARTI T 是 使 用 队列 操作 INSESRT, REMOVE 和 EMPTY 构造 起 来 的 。 








算法 18.4.1 
宽度 优先 自 底 向 上 语法 分 析 
MLA E RXCGXOGE GE (VE PS) 
FAFA pe DL" 
数据 结构 : 队列 Q 
1. 用 根 己 初始 化 了 
INSERT (p, Q) 
2. repeat 
q: -REMOVE (Q) 
2. 1. for P 中 的 每 个 规则 A—w do 
2. 1. 1. for 对 于 每 个 v e X 的 己 的 分 解 uwv do 
2. 1. 1. 1L INSERT (uAv, Q) 
2.1.1.2. 在 了 中 增加 结 点 uAv. 设置 一 个 从 uAv 指向 q 的 指针 . 
end for 
end for 
until g = $ or EMPTY(Q) 
3. if q =S then 接收 else 拒绝 


搜索 树 从 树 根 p 开始 进行 初始 化 。 算 法 的 余下 部 分 包括 以 下 这 些 过 程 : 选择 节点 4 从 而 进行 扩 
展 ， 生 成 4 的 归 约 ， 以 及 更 新 队列 和 树 。 步 又 2. 1. 1 用 于 检查 已 经 被 归 约 的 串 w 的 右边 没有 变量 ， 从 
而 保证 只 有 最 右 推导 被 插入 到 队列 中 ,并 且 该 推导 被 加 入 到 搜索 树 里 。 

图 18-3 显示 了 当 串 (b+5) 使 用 自 底 向 上 语法 分 析 器 来 进行 语法 分 析 的 时 候 所 构造 出 的 搜索 树 。 
沿 着 从 5 到 (b+b) 的 路 径 生 成 了 最 右 推导 树 ， 如 下 所 示 : 
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S =A 

—T 

—(A) 

—(A-T) 

>(A +b) 

>(T+b) 

=>(b +b). 
图 18-3 中 ，(b+5) 使 用 自 底 向 上 语法 分 析 法 生成 搜索 树 ; E 18-2 rP, (b+5) 使 用 自 项 向 下 语法 分 析 
法 生成 搜索 树 ， 将 这 两 者 相对 比 。 将 搜索 限制 到 可 以 产生 ( +b) 的 推导 ， 这 样 可 以 极 大 地 减少 产生 的 
节点 的 数目 。 


(s+) —— (s+r) — (s+4) 一 (+9) 


(s) 
(a+b) — (4+7) eS HP EEG 


(T+b) = (4*4) — (4 +5) 
(b«5) (re — (r«4) — (r^s) 


(b+7) —— (b«4) — (b +s) 
图 18-3 (b+b) 的 自 底 向 上 语法 分 析 


使 用 自 顶 向 下 和 自 底 向 上 的 方法 所 生成 的 搜索 树 的 大 小 是 不 同 的 ， 这 些 关 于 搜索 树 大 小 的 不 同 点 
[564] 生动 地 体现 于 不 在 语言 中 的 那些 串 。 图 18-4 显示 了 对 于 串 (5 + ) 的 语法 分 析 而 产生 的 树 。 根 据 AE 中 
的 最 左 推导 ， 自 顶 向 下 的 分 析 永远 不 会 终止 。 检 查 四 个 节点 之 后 ， 自 底 向 上 的 分 析 就 会 暂停 。 





b (T) 
Top down 
T — (4 —— (+N 
S A b+T 
Ly —— ep per 
AtT+T —— T+T+T 
A+T+T+T = 
Bottom up 
(bt) — — (Pt) (4*) (S+) 








图 18-4 (b+) 的 自 顶 向 下 语法 分 析 和 自 底 向 上 语法 分 析 

自 顶 向 下 语法 分 析 永 远 不 会 停止 ， 自 底 向 上 语法 分 析 在 检查 4 个 节点 之 后 停止 。 

前 面 的 表述 省 略 了 一 个 非常 重要 的 步骤 一 寻找 串 4 的 归 约 。 现 在 将 要 调整 这 个 漏洞 。 串 4 已 经 
具备 了 一 个 归 约 ， 如 果 以 下 条 件 成 立 : 

i) q TARSA uwv, 并 且 

ii) 文法 中 存在 一 个 规则 A—w 

确定 串 4 的 归 约 要 求 规则 的 右 部 需要 有 子 串 9。 这 里 可 以 使 用 一 种 移 进 - 比较 策略 ， 以 产生 串 4 
的 所 有 归 约 。 串 4 被 分 成 两 个 子 串 ，g =xy。 初 始 化 的 划分 将 x 设 为 空 串 ,并 将 y 设 为 gq。 每 条 规则 的 
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右 部 均 与 x 的 后 缀 进行 比较 。 当 x 可 以 写成 uw 的 形式 并 且 A—w 是 文法 的 规则 的 时 候 ， 就 表示 出 现 了 
匹配 。 这 表示 将 q 归 约 为 uAy。 

对 于 一 个 给 定 的 对 区 ， 如 果 所 有 的 规则 都 与 x 的 后 缀 比较 过 ,那么 4 就 被 重新 划分 成 两 个 子 串 x' 
多 ， 并 且 这 个 过 程 会 重复 进行 。 这 个 分 解 将 x' 设 置 成 与 y 第 一 个 元 素 连 接 的 x; y' 就 是 将 y 移 去 其 首 元 
素 后 余下 的 部 分 。 更 新 分 割 的 过 程 被 看 成 是 移 进 。 在 文法 AE 中 ， 移 进 和 比较 操作 用 于 生成 串 (4+7) 
的 所 有 可 能 的 归 约 。 








x y 后 缀 规则 归 约 
入 (A * T) 入 
Shift ( A « T) C, 
Shift (A +T) (AAN SA (SAT) 
Shift (A+ T) (A+ At Vo uA 
Shift (A+T ) GA ey dy ly A—A * T (A) 
AT (A+A) 
Shift (A+T) 入 (A *T),A*T) , *T),T),),À 


在 生成 串 的 归 约 的 过 程 中 ， 规 则 的 右 部 必须 与 zx 的 后 级 相 匹 配 。 所 有 其 他 发 生 在 x 的 规则 右 部 的 
归 约 均 会 在 最 近 一 次 移 进 之 前 被 发 现 。 

如 同 前 面 的 表 中 所 示 ， 入 -规则 将 会 在 每 次 分 解 xy 的 过 程 中 与 一 个 后 级 相 匹 配 ， 并 且 会 为 任何 一 
个 长 度 为 n 的 串 产 生 n+1 个 归 约 。 因 此 ， 自 底 向 上 语法 分 析 算法 不 应 该 被 用 于 使 用 入 -规则 的 文法 。 
然而 ， 入 -规则 不 会 产生 第 20 章 中 所 考虑 的 自 底 向 上 语法 分 析 器 所 产生 的 问题 。 

宽度 优先 自 底 向 上 语法 分 析 器 对 于 每 一 个 可 能 的 输入 串 都 会 停止 吗 ， 或 者 可 以 这 样 说 ， 该 算法 在 
repeat — until 循环 中 会 产生 不 确定 的 继续 吗 ? 如 果 串 p 在 该 文法 的 语言 中 ,那么 将 会 找到 一 个 最 右 推 
导 。 如 果 每 条 规则 的 右 部 的 长 度 均 大 于 1， 那么 一 个 句 型 的 归 约 将 会 产生 一 个 长 度 小 得 多 的 新 串 。 对 
于 可 以 满足 这 种 情况 的 文法 来 说 ， 搜 索 树 的 长 度 不 能 超过 输入 串 的 长 度 ， 要 人 么 找到 一 个 推导 ， 要 么 失 
败 ， 只 有 这 两 种 情况 发 生 ， 从 而 可 以 确保 语法 分 析 的 终止 。 然 而 ， 这 种 情况 并 未 被 具有 AB, A—a 
和 4 一 人 形式 的 规则 所 满足 。 在 练习 11 中 ， 将 会 要 求 读者 给 出 一 个 文法 和 串 ， 使 得 算法 18. 4. 1 永远 
不 会 停止 。 对 于 不 存在 入- 规则 和 链 规则 的 文法 来 说 ,终止 是 可 以 保证 的 。 

在 算法 18. 4. 1 中 ， 对 于 某 个 句 型 来 说 ， 生 成 它 可 能 存在 多 种 动作 ， 那 么 自 底 向 上 语法 分 析 器 的 
有 效 性 将 会 因为 这 个 原因 而 受到 严重 影响 。 例 如 ， 在 都 使 用 规则 AE 的 情况 下 ， 串 4 +T 具 有 两 个 归 
2, 而 b+b+b 具 有 三 个 归 约 。 穷 举 搜索 策略 将 会 执行 每 一 个 归 约 ， 将 产生 的 句 型 加 入 到 搜索 树 中 
X, 并且 生成 他 们 的 后 代 。 为 了 生成 更 多 的 分 析 ， 就 需要 有 能 力 在 每 一 个 步骤 中 选择 一 个 单独 的 动 
作 。 人 允许 确定 型 自 底 向 上 语法 分 析 的 文法 将 在 第 20 章 中 介绍 。 


18.5 语法 分 析 和 编译 


语法 分 析 是 一 个 检验 程序 源 代码 是 否 满足 程序 设计 语言 语法 规范 的 过 程 。 将 用 高 级 语言 书写 的 源 
代码 转换 成 为 可 执行 的 机 器 代码 或 者 汇编 语言 代码 的 整个 过 程 就 是 编译 这 个 程序 的 过 程 。 编 译 程序 包 
括 词法 分 析 ， 词 法 扫描 ， 以 及 代码 的 生成 。 除 了 语法 分 析 ， 编 译 过 程 最 初 的 两 个 步骤 包括 语义 分 析 以 
及 错误 鉴定 和 回复 。 这 里 将 简单 地 讨论 一 下 程序 中 除了 包含 在 词法 分 析 和 词法 扫描 之 中 的 语法 分 析 之 
外 的 部 分 。 

词法 分 析 扫 描 源 代码 并 且 生 成 程序 设计 语言 的 记号 串 。 程 序 设计 语言 的 记号 包括 语言 中 使 用 的 标 
识 符 、 保 留 字 、 文 字 以 及 特殊 符号 。 记 号 串 中 不 包括 空格 键 、 注 释 、 回 车 键 、 换 行 符 以 及 其 他 源 代码 
中 的 非 语言 成 分 。 字 符 序列 有 可 能 不 能 按照 语法 形成 正确 的 标识 符 、 常 量 或 者 特殊 符号 ， 词 法 分 析 也 
会 检测 出 这 样 的 错误 。Java 定义 的 标识 符 要 求 第 一 个 符号 必须 是 字母 、 下 划 线 或 者 是 美元 符号 。 当 词 
法 分 析 遇 到 一 个 没有 满足 要 求 的 符号 串 ， 或 者 与 其 他 任何 一 个 Java 保留 字 相 匹配 的 单词 或 者 符号 的 时 
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候 ， 它 就 会 产生 一 条 错误 信息 。 因 为 程序 设计 语言 的 记号 形成 了 规则 语言 ， 所 以 词法 分 析 经 常 通过 有 
限 自动 机 来 实现 。 

语法 分 析 器 检测 词法 分 析 器 产生 的 记号 串 是 否定 义 了 一 个 语法 正确 的 程序 。 这 是 通过 构造 一 个 推 
导 来 实现 的 ， 推 导 可 以 使 用 自 顶 向 下 和 自 底 向 上 这 两 种 方式 中 的 任何 一 种 ， 这 需要 看 该 串 使 用 哪 种 文 
法 规则 来 定义 程序 设计 语言 。 成 功 的 语法 分 析 会 生成 程序 的 推导 或 者 分 析 树 ( 见 3.1 节 ) 。 

前 两 节 中 所 展示 的 语法 分 析 结 果 只 是 关于 输入 串 的 正确 与 否 的 指示 一 一 接收 或 者 拒绝 。 编译 器 的 
语法 分 析 阶 段 必须 要 定义 语法 错误 ， 为 文法 生成 尽 可 能 多 的 错误 信息 ， 并 且 能 够 从 错误 中 恢复 ， 以 继 
续 其 语法 分 析 。 声 明 终结 符号 、 隔 离 符 号 以 及 特殊 符号 对 于 错误 恢复 来 说 毫 无 意义 。 如 果 在 分 析 一 个 
语句 序列 的 时 候 检测 出 一 个 错误 ， 那 么 就 要 生成 一 条 错误 信息 ， 并 且 语 法 分 析 将 会 继续 进行 下 去 ， 直 
到 它 遇 到 像 分 号 或 者 括 弧 这 样 表示 句子 终结 的 符号 才 会 停止 读 取 记号 。 此 时 ， 语 法 分 析 器 将 会 尝试 继 
续 分 析 正 在 读 取 的 记号 串 的 剩余 部 分 。 

在 语法 分 析 的 过 程 中 ， 通 过 检测 由 语法 分 析 器 产生 的 陈述 语句 的 语义 正确 性 可 以 获得 一 些 信息 ， 
语义 分 析 所 使 用 的 正 是 这 些 信息 。 在 编译 这 个 阶段 ， 可 以 被 定义 的 语义 错误 包括 将 保留 字 声明 为 标识 
符 ， 引 用 未 被 定义 的 变量 ,标识 符 的 多 次 声明 ， 以 及 指派 或 者 操作 过 程 中 的 类 型 不 兼容 等 。 

在 成 功 地 进行 了 词法 分 析 和 语义 分 析 之 后 ， 语 法 分 析 树 就 被 频繁 地 用 于 生成 程序 的 中 间 语 言 的 表 
述 形式 。 设 计 中 间 表 述 是 为 了 方便 编译 的 最 后 一 个 步骤 : 机 器 语言 或 者 汇编 语言 代码 的 优化 转换 。 


18.6 练习 


1. 构造 下 述 文法 G 的 图 的 子 图 ， 该 文法 包括 少 于 三 步 的 推导 生成 的 左 句 型 。 
G: S—aS| AB| B 
A—abA | ab 
B—BB | ba 
2. 构造 下 述 文法 G 的 图 的 子 图 ， 该 文法 包括 不 多 于 四 步 的 推导 生成 的 左 句 型 。 
G: S—aSA | aB 
ABA | X 
B—cB|c 





G 是 二 义 性 的 吗 ? 
从 练习 3 到 练习 7， 使 用 文法 AE 来 分 析 输 入 串 ， 并 追踪 算法 的 行为 。 如 果 该 输入 串 在 语言 中 ， 那 么 给 出 
语法 分 析 所 构造 出 的 推导 。 


3. 将 算法 18. 2. 1 中 的 输入 变 成 (b) +b。 

4. 将 算法 18.2.1 中 的 输入 变 成 +(b)。 

5. 将 算法 18. 2. 1 中 的 输入 变 成 ( (45) ) 。 

6. 将 算法 18. 4. 1 中 的 输入 变 成 (b) +b。 

7. 将 算法 18. 4. 1 中 的 输入 变 成 (b) ) 。 

8. Eb) +b 进行 分 析 ， 请 给 出 由 算法 18. 2. 1 和 算法 18. 4. 1 生成 的 搜索 树 的 前 五 层 。 

9. 设 文法 G 为 
l. $S$—aS 
2. S—AB 
3. A-bAa 
4. Aa 
5. B—bB 
6. B—b. 


a) 给 出 L(G) 的 一 个 集 论 (set - theoretic) 定义 
b) 给 出 baab 的 自 顶 向 下 语法 分 析 所 构造 的 树 
c) 给 出 baab 的 自 底 向 上 语法 分 析 所 构造 的 树 











10. 设 文法 G 为 


Du epp 
> 
| 
> 


a) 给 出 工 (G) 的 一 个 正则 表达 式 。 
b) 给 出 abbbaa 的 自 顶 向 下 语法 分 析 所 构造 的 树 。 
c) 给 出 abbbaa 的 自 底 向 上 语法 分 析 所 构造 的 树 。 

11. 构造 一 个 不 包括 入 - 规则 的 文法 G URP peL’, ORR IK 18.4. 1 在 尝试 语法 分 析 p 的 时 候 会 陷入 不 
确定 的 循环 。 

12. 假设 文法 的 开始 符号 S 是 非 递 归 的 。 更 改 算法 18. 4. 1， 使 得 每 当 有 串 包 含 8 的 时 候 ， 该 算法 都 不 会 继 
续 进行 搜索 。 使 用 文法 AE 和 输入 (b+5) 来 跟踪 已 更 改 算法 的 语法 分 析 。 将 所 得 的 树 与 图 18-3 中 的 搜索 
树 相 比 。 


参考 文献 注释 


本 章 所 表述 的 语法 分 析 器 是 为 了 适用 于 特殊 的 应 用 程序 而 改进 的 图 搜索 算法 。Knuth [1968] 中 
给 出 了 图 的 完整 展示 和 树 遍 历 ， 并 且 对 于 数据 结构 有 很 多 的 文字 描述 。 对 于 语法 分 析 和 编译 的 一 个 全 
面 的 引 论 可 以 在 Aho, Sethi 和 Ullman [1986] 中 找到 。 对 于 确定 型 语法 分 析 技 术 有 用 的 文法 将 会 在 
第 19 章 和 第 20 章 中 介绍 。 关 于 语法 分 析 的 参考 书目 ， 可 以 参看 章节 后 面 的 参考 文献 注释 。 
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eB 19:39 LL(h) 文 法 


当 在 搜索 树 中 扩展 一 个 节点 的 时 候 ， 有 可 能 出 现 几 种 选项 同时 存在 的 情况 ， 这 也 是 第 18 章 中 所 
介绍 的 算法 效率 低下 的 基本 原因 。 设 4 是 句 型 中 的 最 左 推导 ， 那 么 自 顶 向 下 的 分 析 器 将 会 应 用 每 一 个 
规则 4， 从 而 可 以 扩展 其 推导 。 对 于 一 个 给 定 的 串 来 说 ， 自 底 向 上 的 分 析 器 可 能 会 有 多 个 归 约 。 但 无 
论 是 哪 种 情况 ， 分 析 器 均 执行 所 有 可 能 的 动作 ， 将 结果 生成 的 句 型 加 入 到 搜索 树 中 去 ， 并 生成 其 
后 代 。 

如 果 存 在 足够 的 信息 ， 能 够 保证 每 一 步 均 可 以 选择 惟一 的 动作 来 执行 ,那么 这 样 的 分 析 算 法 就 是 
确定 型 的 。 对 于 自 项 向 下 的 分 析 器 来 说 ， 这 就 意味 着 在 可 能 的 规则 中 ， 自 顶 向 下 的 分 析 器 可 以 确定 应 
用 其 中 的 哪 一 条 规则 。LL(k) 文 法 是 上 下 文 无 关 文 法 中 的 最 大 子 类 ， 该 文法 允许 确定 型 的 自 顶 向 下 分 
析 絮 可 以 预 读 个 符号 。 这 些 文法 是 为 了 某 些 特定 的 分 析 策 略 而 设计 的 ， 符 号 LL 则 描述 了 这 样 的 分 
析 策 略 ; 分 析 器 按 从 左 到 右 的 方式 扫描 输入 串 ， 然 后 生成 一 个 最 左 推导 。 预 读 可 以 读 取 分 析 器 生成 的 
那 部 分 输入 串 之 外 的 部 分 ， 这 就 为 选择 执行 合适 的 动作 提供 了 附加 的 信息 。 

在 本 章 中 ， 所 有 的 推导 和 规则 应 用 都 是 按 最 左 方式 进行 的 。 这 里 也 假设 本 章 的 文法 是 无 二 义 性 
的 ， 并 且 不 包含 无 用 符 。 用 于 检测 和 移 除 无 用 符 的 技术 在 4. 4 节 中 介绍 过 。 


19. 1 上 下 文 无 关 文 法 中 的 预 读 


对 于 一 个 输入 串 忆 来 说 ， 自 项 向 下 的 分 析 器 尝试 构造 该 串 的 最 左 推导 。 分 析 器 应 用 规则 4， 扩 展 
具有 形式 S SuAv 的 推 时， 在 这 里 ,，u p 的 前 级 。 输 入 串 中 的 预 读 可 以 减少 必须 进行 检测 的 规则 A 
的 数目 。 如 果 p =uav， 那 么 终结 符 a 可 以 通过 在 由 分 析 器 生成 的 输入 串 的 前 级 之 外 的 部 分 寻找 一 个 符 
号 来 获得 。 使 用 预 读 符号 就 可 以 不 必 考 虑 规则 的 右 部 是 以 终结 符 而 不 是 以 a 开始 的 规则 A。 任 何 一 个 
这 样 的 规则 的 应 用 都 会 生成 一 个 前 缀 不 是 p 的 终结 符 串 。 

用 下 边 的 正则 文法 来 思考 串 acbb 的 推导 

G: S—aS| cA 
A—bA | cB| X 
B—cB | a| X. 
推导 从 开始 符号 3 开始， 并且 预 读 符号 a。 这 个 文法 包括 两 个 5 规 则 、5->aS 和 $-c4。 很 显然 ， 应 用 
规则 ScA 是 不 能 产生 acbb 的 推导 的 ， 这 是 因为 c 并 不 和 预 读 符号 相 匹 配 。 这 样 看 来 ，acbb 的 推导 
必须 从 规则 Sas 开始 。 

应 用 完 规则 S 以 后 ， 预 读 符号 就 到 了 c 面前 。 再 一 次 可 以 看 到 ， 只 有 一 个 8 规则 可 以 产生 c。 将 

预 读 符号 与 每 个 相应 规则 中 的 终结 符 进行 比较 ， 则 可 以 生成 G 中 的 推导 的 确定 型 的 构造 。 





E RERO BUR 预 读 符号 规则 推导 
入 a S—aS SaS 
a Ü S—+cA —acA 
ac b A—bA —acbA 
acb b A—bA —acbbA 
acbb 入 4 一 人 入 —acbb 


预 读 一 个 符号 对 于 确定 型 地 构造 文法 G 中 的 推导 来 说 已 经 足够 了 。 一 种 更 为 普通 的 方法 是 允许 预 
读 还 未 生成 的 输入 串 的 部 分 。 终 结 符 串 p 推导 的 一 个 中 间 步 骤 具 有 5 uA 这 种 形式 ， 这 里 p ux, $ 
x 被 称 为 预 读 囊 (lookahead string) 是 因为 变量 4 的 原因 。4 的 预 读 集合 包含 了 所 有 用 于 那个 变量 的 预 
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读 串 。 

定义 19.1.1 设 G =(V,Y,P,S) 是 上 下 文 无 关 文 法 ， 并 且 

i) 变量 4 的 预 读 集合 是 LA (4) ， 其 定义 如 下 : 

LA(A) = |x| SSuAv Suxe X ' |. 
ii) 对 于 已 中 的 每 个 规则 Aw, 规则 A—w 的 预 读 集合 均 定义 如 下 : 
LA(A—w) = |x| wv Sx,xe X ,Ss SuAv|. 

LA(4) 包 含 了 所 有 可 以 从 串 Av 推导 出 的 终结 符 串 ， 这 里 whv 是 语法 的 左 句 型 。LA(A 一 w) 是 
LA(A) 的 子 集 ， 子 推导 Av x 是 从 规则 Aw 开始 进行 初始 化 的 。 

设 4 一 w ，…，4 一 Ww, 是 语法 G 的 规则 4。 每 当 集合 LA(4 一 w;) 分 割 LA(4) 的 时 候 ， 就 可 以 利用 
预 读 串 来 选择 合适 的 规则 4， 也 就 是 说 ， 当 集合 LACA—w,) 满足 


i) LA(A) = U LA(A—w,), 3H. 
ii) HFA I<isjan Ki, LA(A—>w;,) N LA(A—>w,) =Ø. 


对 于 任何 一 种 上 下 文 无 关 的 文法 来 说 ， 第 一 种 情况 均 可 以 得 到 满足 ; 这 是 直接 从 预 读 集合 的 定义 继承 


下 来 的 。 如 果 预 读 集合 满足 (du), IFA p =uxe L(G) EB p 2 ux WBMES, ABA x 就 必然 是 某 个 集 
A LA(A—w,) 的 元 素 。 因 此 ， 应 用 规则 4 一 wx 会 使 得 推导 成 功 完成 ， 并 且 该 规则 是 惟一 的 。 
例 19.1.1 预 读 集合 是 为 文法 的 变量 和 规则 而 构造 的 
G,: S—»Aabd| cAbcd 
Aa | b| x. 
LA(S) M & f Bri A S 推导 出 来 的 终结 符 串 。 每 一 个 从 规则 S—Aabd 推导 出 的 终结 符 串 均 是 以 a 或 者 
b 开头。 另 一 方面 ,规则 S—cAbcd 开始 进行 初始 化 的 推导 则 生成 了 以 “ 为 开始 符号 的 串 : 
LA(S) = | aàbd ,babd ,abd ,cabcd ,cbbcd ,cbcd | 
LA( S—4Aabd) = | aabd ,babd ,abd| 
LA( S—cAbcd) = | cabcd ,cbbcd ,cbcd | 
选择 合适 的 规则 S 的 充分 条 件 是 需要 获得 预 读 串 的 第 一 个 符号 的 信息 。 
为 了 构造 变量 A 的 预 读 集合 ， 就 必须 要 考虑 G 中 所 有 包含 4 的 左 句 型 的 推导 。 这 里 只 有 两 个 这 
样 的 句 型， 即 Aabd 和 cAbcd。 预 读 集 合 包 含 了 从 Aabd 和 Abcd 推导 出 来 的 终结 符 串 。 
LA(A—a) = | aabd ,abcd| 
LA(A—b) = | babd ,bbcd| 
LA(A—) = | abd bcd| 
FB ab FT LD ALM Aa 应 用 到 串 Abcd， 以 及 将 规则 A— 应 用 到 串 4apd 来 获得 。 这 样 ， 两 个 符 
号 的 预 读 对 于 选择 正确 的 规则 A 来 说 并 不 是 充分 的 。 为 了 区 别 对 待 这 些 规 则 ， 必 须要 能 够 提供 充足 的 
信息 ， 这 就 需要 能 够 在 输入 串 中 预 读 三 个 符号 。 能 够 预 读 三 个 符号 的 自 顶 向 下 的 分 析 器 可 以 构造 出 文 
ik G, 的 确定 型 推导 。 口 
变量 A 的 预 读 串 是 两 个 推导 结果 的 连接 ， 一 个 来 自 于 变量 4， 另 一 个 来 自 于 跟随 4 的 句 型 的 部 
分 。 例 19. 1. 2 强调 了 句 型 的 预 读 集合 之 间 的 依赖 关系 。 
例 19.1.2 G, 的 预 读 集合 从 每 个 变量 A、B 和 C 至 多 接收 一 个 终结 符 ，G; 的 文法 如 下 所 示 : 
G,: S—ABCabcd 
Aa | 入 
B—>b| N 
C—c| X 
G, 中 惟一 包含 4 的 左 句 型 是 ABCabcd。 变 量 B 出 现在 aBCabcd 和 BCabcd 中 ， 这 两 者 均 可 以 通过 应 用 
规则 A 到 ABCabcd 而 获得 。 无 论 是 哪 种 情况 ，BCabcd 都 被 用 于 构造 预 读 集合 。 类 似 地 ， 预 读 集合 
LA(C) 包 含 了 从 Cabcd 推导 出 的 串 。 
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LA(A—a) = | abcabcd ,acabcd ,ababcd , aabcd | 
LA(A—)) = | bcabcd ,cabcd , babcd , abcd} 
LA( B—b) = | bcabcd , babcd} 
LA(B->)) = | cabcd, abcd} 
LA( Cc) = | cabcd| 
LA( CA) = | abcd} 
对 于 选择 规则 B 和 规则 C 来 说 ， 长 度 为 一 的 预 读 可 以 提供 充分 的 信息 。 带 前 缀 的 串 abc 可 以 通过 使 用 
规则 A—a 或 者 规则 4 一 从 句 型 A4BCabcd 推导 出 来 。 长度 为 四 的 预 读 集合 可 以 用 于 确定 型 地 分 析 G, 
中 的 串 。 回 
预 读 集合 LA(4) 和 LA(4 一 w) 可 能 包含 任意 长 度 的 串 。 以 前 例子 中 的 规则 选择 只 是 需要 预 读 集合 
中 的 串 的 定 长 前 级 。 具 有 上 个 符号 的 预 读 集 合 通 过 截取 集合 LA(A) 和 LA(A 一 w) 中 的 串 来 获得 。 这 里 
引入 函数 trunc 来 简化 定 长 预 读 集合 的 定义 。 
定义 19.1.2 设 G=(V, 工 ,P,S) 是 上 下 文 无 关 文 法 ,大 为 大 于 0 的 自然 数 s 
i) truc, &JKP(X') 8I2(X^) 的 函数 ， 其 定义 如 下 : 
trunc, (X) = |u| we X B. length(u) Sk %# uve X H length(u) =k} 
STH Xe PCL) RH 
i) 变量 4 的 长 度 为 大 的 预 读 集合 如 下 : 
LA,(A) z trunc, (LA(A) ). 
ii) 规则 A—w 的 长 度 为 k 预 读 集合 如 下 所 示 : 
LA,(A—>w) =trunc, (LA(A—w) ). 
例 19.1.3 例 19.1.1 中 用 于 文法 G, 中 的 规则 的 长 度 为 三 的 预 读 集合 如 下 所 示 : 
LA, (S—Aabd) = | aab, bab ,abd| 
LA, (S—cAbcd) = | cab ,cbb ,cbc| 
LA, (A—>a) = | aab ,abc| 
LA, (A—>b) = | bab, bbc} 
LA, (AA) = {abd,bcd}. 
因为 对 于 规则 S 或 者 规则 4 来 说 ， 它 们 长 度 为 三 的 预 读 集合 中 没有 公共 串 ， 所 以 具有 三 个 符号 的 预 读 
集合 对 于 决定 选择 G, 中 合适 的 规则 来 说 是 充分 的 。 口 
例 19.1.4 语言 aabc |i>0} 是 由 文法 G,、G, AG, 中 的 任意 一 个 生成 的 。 下 面 给 出 了 这 些 文 
法 的 最 短 长 度 的 预 读 集合 ， 这 些 预 读 集合 对 于 区 分 可 选择 的 生成 来 说 是 必须 的 。 


具有 一 个 字符 的 预 读 是 不 能 为 确定 C, 中 的 规则 8 提供 am WEAR — 
充分 的 信息 的 ， 这 是 因为 两 个 选择 都 是 以 符号 a 开头 的 。 实 Gs Sase [aaa] 
际 上 ， 需 要 具有 三 个 符号 的 预 读 才能 够 确定 合适 的 规则 。 文 S—raabe [aab] 
法 G, 是 从 文法 G, 通过 使 用 规则 S 生成 第 一 个 a 构造 出 来 9: SN 
的 。 在 G, H, 加 入 变量 A， 从 而 生成 规则 S 的 右 部 。 这 种 js E 
技术 被 称 为 提取 左 因子 (left factoring) ， 这 是 因为 第 一 个 a。 o, pipl 
是 从 规则 S—aSe 和 规则 Saabe 中 被 提取 出 来 的 。 对 规则 8 Pao TT 
使 用 提取 左 因子 的 方法 减少 了 选择 规则 所 需 的 预 读 集合 "EH ib] 
的 长 度 。 

长 度 为 一 的 预 读 对 于 分 析 Gs 中 的 规则 的 串 来 说 是 充分 的 。 当 间接 递归 规则 通过 生成 鼠 而 终止 了 
其 推导 的 时 候 ， 递 归 规则 4 则 生成 了 a。 口 


19.2 FIRST 集合 、FOLLOW 集合 和 预 读 集合 
可 以 看 出 ， 利 用 预 读 集 来 选择 合适 的 规则 从 而 推导 出 一 个 所 需要 的 串 是 可 行 的 。 每 一 个 变量 和 规 
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则 均 生 成 预 读 集合 ， 这 对 于 将 这 个 信息 合并 到 分 析 器 中 去 来 说 是 必要 的 。 本 节 将 会 介绍 FIRST 集 和 
FOLLOW 集 的 内 容 ， 这 两 种 集合 可 以 直接 从 文法 规则 中 构造 预 读 集合 。 
预 读 集合 LA;(4) 包 含 可 以 从 变量 A 推导 出 来 ， 并且 长 度 最 大 为 上 的 串 的 前 级 。 如 果 A 推导 出 长 
度 小 于 大 的 串 ， 那 么 预 读 集 合 余下 的 部 分 将 从 以 4 为 开始 ， 并 且 按 照 文 法 句 型 进行 的 推导 中 得 来 。 对 
于 每 一 个 变量 4， 这 里 引入 集合 FIRST, (A) fl FOLLOW,(4) ， 从 而 为 构造 预 读 集合 提供 所 需 的 信息 。 
FIRST, (4) 包含 从 A 推导 出 来 的 终结 符 串 的 前 级 。FOLLOW, (A) 包含 终结 符 串 的 前 级 ， 而 这 些 终结 符 
可 以 放置 在 从 A 推导 出 的 串 的 后 面 , 为 了 方便 ,为 每 一 个 在 (VU 二) "中 的 串 都 定义 一 个 
FIRST, 集合 。 
定义 19.2.1 设 G 是 上 下 文 无 关 文 法 。 对 于 任意 一 个 串 ue(VUL)* HHK>0, KF FIRST,(u) 
的 定义 如 下 : 
FIRST,(u) = trunc,( |x| uSx,xe X^ 1). 
例 19.2.1 使 用 G, SCRE S RI ABC 建立 的 FIRST 集合 如 下 (文法 G, 见 例 19.1.2) : 
FIRST, (ABC) = la,b,c,A| 
FIRST, (ABC) = | ab ,ac bc ,a,b,c,A| 
FIRST, (S) = | abc ,aca ,aba ,aab ,bca ,bab ,cab| [3 
回想 前 面 提 到 的 用 并 置 来 表示 将 集合 X 和 集合 Y 连接 起 来 。XY = ixy|xeX EH y e Yl; it 
使 用 这 个 概念 ， 可 以 建立 起 FIRST, 集合 的 下 列 关系 。 
引 理 19.2.2 对 于 每 一 个 k>0， 
1. FIRST, (A) = 1A] 
2. FIRST, (a) = {a} 
3. FIRST, (au) = {av| ve FIRST, (u) } 
4. FIRST, (uv) = trunc, (FIRST, (u) FIRST, (v) ) 
5. 如 果 A—w X X ik G 中 的 规则 ， 那 么 FIRST,(w) e FIRST,(A). 
定义 19.2.3 设 G 是 上 下 文 无 关 文 法 。 对 于 每 一 个 AeV， H#HK>0, KS FOLLOW,(A) X X. 
如 下 : 
FOLLOW, (A) = |x| SSuAv, 并 有 xeFIRST,(v)}. 
FOLLOW,(A) 集 合 包 含 了 终结 符 串 的 前 组 ,这 些 终结 符 串 可 以 跟随 G 中 推导 的 变量 4。 这 是 因为 
空 串 可 以 放 在 任何 一 个 仅 包含 开始 符号 的 句 型 的 推导 的 后 面 ， Ne FOLLOW,(5S)。 
例 19.2.2 给 出 变量 G, 的 长 度 为 一 和 二 的 FOLLOW 集合 。 


FOLLOW, (S) = | 入 | FOLLOW, (S) = {| 

FOLLOW, (A) = {a,b,c} FOLLOW, (A) = | ab,bc,ba,ca| 

FOLLOW, (B) = {a,c} FOLLOW, (B) = | ca,ab} 

FOLLOW, (C) = |a} FOLLOW, (C) = | ab} m 


在 某 些 规则 中 ， 变 量 B 出 现在 规则 的 右 部 ， 那 么 变量 B n FOLLOW 集 可 以 从 这 样 的 规则 中 获得 。 
考虑 由 形 如 A—uBv 的 规则 生成 的 关系 。B 之 后 的 串 包括 那些 由 v 与 其 他 4 之 后 的 终结 符 连接 起 来 而 
生成 的 串 。 如 果 文 法 包含 规则 4 一 wB， 那 么 任何 一 个 A 之 后 的 串 也 可 以 放置 在 B 之 后 。 前 面 的 讨论 将 
会 在 引 理 19. 2.4 中 得 到 总 结 。 

引 理 19.2.4 对 于 每 一 个 k>0， 

1. FOLLOW,(S) 包 含 和 A， 其 中 S 是 文法 G 的 开始 符号 ， 

2. 如 果 A—uB 是 文法 G 的 规则 ， 那 么 FOLLOW,(A) CFOLLOW,(B), 

3. 如 果 AuBv 是 文法 G 的 规则 ， 那 么 trunc ( FIRST, ( v) FOLLOW, (A) ) CFOLLOW, (B) 。 

FIRST, 和 FOLLOW, 集合 用 于 为 文法 规则 构造 预 读 集合 。 现 在 ， 已 经 定义 好 了 长 度 为 无 的 预 读 集 
合 以 及 函数 trunc, ， 下 面 就 米 介 绍 定理 19.2.5, 
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定理 19.2.5 设 G=(V, 台 ,P,5S) 是 上 下 文 无 关 文 法 。 对 于 每 一 个 k>0，A eV， 并 且 规 则 Aw = 
uu u, EPP, 
i) LA,(A) = trunc,(FIRST,(A)FOLLOW,(A)) 
ii) LA,(A—>w) = trunc,(FIRST,(w)FOLLOW, (A) ) 
= trunc, ( FIRST, (u, ) --- FIRST, (u,) FOLLOW, (A) ). 
$|19.2.3 19.1.1 中 的 文法 如 下 : 
G,: S—Aabd| cAbcd 
A—a| b| X 
该 文法 中 用 于 符号 的 FIRST, 集 和 FOLLOW, 集 如 下 : 
FIRST, (S$) = | aab,bab,abd,cab,cbb, cbc} 
FIRST;(A) = la,b,A] 


FIRST, (a) = {a} 
FIRST; (b) = {b} 
FIRST, (c) = {c} 
FIRST; (d) = |d} 


FOLLOW, (S) = {a} 
FOLLOW, (A) = | abd,bcd}. 
集合 LA, (SAabd) 是 利用 引 理 19. 2.5 中 的 策略 由 集合 FIRST, (A) „FIRST, ( a) , FIRST, ( b) , FIRST, 
(d) 和 FOLLOW, (S) fait ifii X. o 
LA, (S—Aabd) = trunc, (FIRST, (A) FIRST, (a) FIRST, (b) FIRST, ( d) FOLLOW, (S) ) 
=trunc,({a,b,r} lal ibl {a} 1X1) 
= trunc, ( | aabd ,babd ,abd | ) 
= | aab ,bab ,abd | 
G, 规则 中 长 度 为 三 的 预 读 集合 的 余下 部 分 可 以 在 例 19. 1.3 中 找到 。 口 


19.3 5% LL( AI) 语法 


如 果 LA(4) 被 集合 LA(4 一 w;) 分 割 ， 那 么 在 选择 自 顶 向 下 的 分 析 中 ， 预 读 集合 可 以 用 于 选择 规 
则 4。 本 节 介 绍 了 上 下 文 无 关 文 法 的 一 个 子 类 ， 我 们 称 之 为 强 LL(k) 文 法 。 强 LL) 的 情况 确保 了 预 
读 集合 LA, (4) 是 被 集合 LA,(4 一 w;) 分 割 的 。 

当 使 用 一 个 具有 个 符号 的 预 读 的 时 候 ， 如 果 存 在 K 个 符号 需要 进行 检查 ， 那 么 这 是 有 帮助 的 。 
语言 中 每 个 串 的 末尾 都 被 连接 上 一 个 边界 标记 漂 ， 这 样 做 的 原因 是 为 了 保证 每 个 预 读 集合 都 能 够 正确 
地 包含 上 个 符号 。 如 果 文 法 的 开始 符号 S 是 间接 递归 的 ,边界 标记 就 可 能 被 连接 到 每 个 规则 S 的 右 部 。 
否则 ， 可 以 使 用 新 的 开始 符号 8' 来 对 文法 进行 增长 ， 即 增长 规则 S' Ss 

定义 19.3.1 设 G=(V, 二 ,P,8) 是 具有 边界 标记 末 的 上 下 文 无 关 文法 。 如 果 无 论 何 时 都 会 存在 - 
两 个 最 左 推导 ， 那 么 G 是 强 LL(k) 的 ， 最 左 推导 形式 如 下 所 示 : 

S Su Av, =u,xv, Su, zw, 
S Su, Av, >u,yv, Su,zw,, 
AF u, w;zeX',3tHlength(z) =k, AAx=y, 

下 面 来 看 下 强 LL(k) 文 法 的 几 个 特性 。 首 先 ， 在 强 LL(k) SCE, TEKEN k ORES 
确定 型 地 分 析 串 。 

定理 19.3.2 文法 G 是 强 LL(K) 的 ， 当 且 仅 当 对 于 每 个 变量 4AEV， 集 合 LA, (A 一 w,) 均 分 
ŽILA, (A). 
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证 明 : 假设 对 于 每 个 变量 AeV, RA LA,(Aw;) E] LA, (A). Wb z 是 可 以 通过 推导 获得 的 并 

且 长 度 为 大 的 终结 符 
S Su Av, >u,xv, Su zw, 
S Su, Av, 2u,yv, Su zw,. 

BBA z ALE LA, CA—x) rh, MEELA, CASy) rPo. HARA LA, CA w,) SPH T LALCA) ,那么 x =y 
JFH. G 是 强 LL(k)。 

反 过 来 看 ,假设 G 是 强 LL(k) 文 法 , 并 且 z 是 LA.(4) 的 元 素 。 强 LL(K) 的 情况 能 够 确保 只 有 一 
个 规则 4， 使 得 该 规则 可 以 用 于 将 G 的 句 型 My 推导 成 uzw 形式 的 终结 符 串 。 因 此 ，z 只 是 存在 于 某 
一 个 确定 的 规则 A 的 预 读 集合 里 。 这 就 暗示 着 集合 LA, (A—w,) 48 LA, (A). 图 

定理 19.3.3 ”如果 对 于 某 些 下 来 说 ，G 是 强 LL(Kk) 的 ， 那么 G 就 是 无 二 义 性 的 。 

直观 地 说 ， 一 个 可 以 被 确定 型 分 析 的 文法 必须 是 无 二 义 性 的 ; 终结 符 串 的 每 一 步 推导 只 可 以 应 用 
某 个 确定 的 规则 。 这 个 命题 的 证 据 留 做 练习 。 

定理 19.3.4 AK G 具有 左 递归 变量 ， 那 么 G 就 不 是 强 LL( 有 的 ， 这 对 于 任何 大 >0 均 成 立 。 

证 明 : 设 4 是 左 递归 变量 ， 因 为 G 不 包含 无 用 变量 ， 因 此 就 存在 一 个 终结 符 的 推导 ， 该 终结 符 包 
含 变 量 4 的 左 递归 子 推导 。 我 们 分 为 下 面 两 种 情况 进行 证 明 。 

情况 1: 4 是 直接 左 递归 。 推 导 包 括 直接 左 递归 使 用 形式 A—Ay 和 Ax 的 规则 4， 这 里 的 第 一 
个 符号 不 是 4。 

S =>uAv —uAyv =uxyv Suwe Y," $ 

长 度 为 上 的 w MRR LA, (A>Ay) P, XE LA, Ax) 中。 根据 定理 19.3.2，G 是 强 LL(K) 的 。 

情况 2: A 是 间接 左 递 归 的 。 间 接 递归 的 推导 具有 以 下 形式 : 

S SuAv —uB,yv 全 全 MUAv ,,— uxw, > uwe X. 


再 一 次 可 以 看 出 ， 因 为 集合 LA, (AB, y) 和 LA,(4-*xz) 是 相交 的 ， 所 以 G 是 LL( 有 的 。 F 
19.4 FIRST, 集合 的 构造 


下 面 介绍 一 个 算法 ， 这 个 算法 可 以 为 带 有 边界 标记 # 的 上 下 文 无 关 文 法 构造 出 长 度 为 天 的 预 读 集 
合 。 这 是 通过 为 文法 的 变量 生成 FIRST, 集合 和 FOLLOW, 集合 来 完成 的 。 那 么 预 读 集合 就 可 以 通过 
使 用 定理 19. 2. 5 中 的 技术 来 构造 。 

构造 预 读 集 合 的 初始 化 步骤 从 生成 FIRST, 集合 开始 。 考 虑 具有 形式 Aou, umu, 的 规则 。 这 个 规 
则 生成 的 FIRST, (A) 的 子 集 可 以 从 集合 FIRST, ( uy 35 FIRST, ( u, JP ES , FIRST, ( u,) 以 及 FOLLOW, (A) 
中 构造 出 来 。 为 串 构造 FIRST, 集合 就 可 以 看 成 是 寻找 串 中 变量 的 集合 。 


算法 19.4.1 

FIRST, 集合 的 构造 

mA: ETXERA G=(V,>,P,S) 

l. for 每 个 a e X, do F' (a): = {a} 

{A} if A>) 是 P 中 的 规则 
名 否则 





2.for 每 个 A eV do F(A): =f 


3. repeat 
3.1 for 每 个 4 eV do F'(A): =F(A) 
3.2 for 每 个 规则 A—u,u,---u,(n>0 )do 
F(A): =F(A) U trunc, CF'(Cu, )F'(,) --F'(u,)) 
until 对 于 所 有 Ae VARA F (A) =F’ (A) 成 立 
4. FIRST, (A) =F(A) 
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FIRST, (A) 的 元 素 在 步骤 3. 2 中 生成 。 在 repeat - until 循环 的 每 个 迭代 的 开始 ;辅助 集合 E'(4) 即 
被 指派 成 F(4) 的 当前 的 值 。 从 连接 F'(a ) F' (um) F'(Qu, ) 获 得 的 串 ， 则 被 加 入 到 FF(4) 中 去 ,这 里 
Au, uu, te OK G 中 的 规则 。 当 某 个 迭代 中 F(A4) 已 经 没有 集合 需要 被 更 改 ， 则 算法 停止 。 
例 19.4.1 算法 19.4.1 为 文法 变量 构造 FIRST, 集 , 文法 定义 如 下 所 示 : 
G; S—AtHt 
A—aAd | BC 
B—bBc | X 
C—acC | ad. 
对 于 每 一 个 ae 王 ， 集 合 F'(a) 被 初始 化 为 1a| 。repeat - until 循环 的 动作 利用 语法 规则 的 右 部 进行 描 
R. ARR 3. 2 生成 了 G 规则 的 指定 声明 。 
F(S) : =F(S) Utrunc, CF' (A) | #| {#}) 
F(A) : zF(A) Utrunc, ( | a} F'(A) | d] ) Utrunc; (F'(B) F'(C)) 
F(B) : =F(B) Utrunc, ( |b} F'(B) {jc} ) 
581 F(C): =F(C) Utrunc,( {a} | c] F'(C) ) Utrunc,( lal | d] ) 
在 循环 的 每 个 迭代 之 后 给 出 集合 F(S)，F(4)，F(B8) 和 F(C) 的 状态 ,这 样 可 以 追踪 FIRST, 集 的 生成 
情况 。 回 想 前 面 说 到 的 空 集合 和 生成 空 集合 的 集合 之 间 的 连接 。 








F(S) F(A) F(B) F(C) 
0 Ø ! Ø Ia} Ø 
1 [7] [7] IX, bc] | ad] 
2 [7] lad ,bc| | X, bc, bb} | ad ,ac| 
3 | ab ,bc| | ad ,bc ,aa ,ab ,bb ,ac | 1X, bc, bb| | ad ,ac| 
4 | ad ,bc ,aa ,ab ,bb ,ac| lad ,bc ,aa ,ab ,bb ,ac| | x, be, bb} | ad ,ac| 
5 l ad bc ,aa ,ab ,bb ,ac | lad ,bc ,aa ,ab ,bb ,ac| I x, be, bb} | ad , ac] 着 | 


定理 19.4.2 ZG=(V, E, P, S) 是 上 下 文 无 关 文 法 。 对 于 每 个 变量 eV， 算法 19.4.1 可 以 
生成 其 FIRST,(A) 集 合 。 

证 明 : 证 明 包括 说 明 步 骤 3 中 的 repeat — until 循环 会 终止 ， 并 且 终 止 的 时 候 ，F(4) =FIRST, (A), 

i) 算法 19. 4. 1 终止 的 情况 。repeat — until 循环 的 迭代 次 数 会 受到 限制 ， 这 是 因为 对 于 长 度 为 人 
或 者 长 度 小 于 大 的 预 读 串 来 说 ， 其 数目 是 受到 限制 的 。 

ii) F(A) =FIRST,(4) 的 情况 。 首 先 , 需要 证 明 对 于 任意 变量 A e V,F(A) GFIRST, (A) HRL 
为 了 完成 这 个 证 明 ， 就 要 先 说 明 在 每 一 个 repeat — until 循环 的 迭代 的 开始 ，F(4) GFIRST, (A); Bit 
检查 ， 这 个 式 子 在 第 一 个 迭代 之 前 是 有 效 的 。 假 设 在 循环 的 第 m 个 迭代 之 前 (包括 第 m 个 迭代 ) ， 所 
有 变量 A 均 满足 这 个 式 子 。 

那么 ,在 第 m+1 个 迭代 的 过 程 中 ， 对 FCA) 的 惟一 增加 来 自 于 下 述 形式 的 指派 声明 ， 

F(A): =F(A) Utrunc, (F'(u,) F'(1,)--F'(u,)), 
这 里 A—u, uu, 是 文法 G 的 规则 。 根 据 归纳 假设 ,每 一 个 F'(w,) 集 合 都 是 FIRST,(u,) 的 子 集 。 如 果 
在 这 个 迭代 中 , u 被 加 入 到 F (A) 中 去 ,那么 
u etrunc,(F'(u,) F'CGi)--F'(u,)) 

C trunc, ( FIRST, (u,) FIRST, (15 ) --- FIRST, (u, )) 

= FIRST, (u u, +u, ) 

CFIRST, (A) 
并 且 u e FIRST, (A)。 最 后 两 步 推 导 过 程 是 从 引 理 19. 2. 2 中 推导 出 来 的 。 

现在 要 说 明 的 是 ， 在 循环 完成 的 时 候 ，F(4) CFIRST, (A) ERM., B F, (A) ERA F(A) m 
次 循环 反复 之 后 的 值 。 假 设 repeat - until 循环 在 j 次 反复 之 后 停止 。 首 先 ， 我 们 看 一 下 对 于 某 个 m >j， 

是 否 存在 一 个 串 ， 当 该 串 可 以 在 F, (4) 中 的 时 候 ， 该 串 就 在 F(A4) 中 。 这 是 因为 对 于 任何 循环 迭代 次 
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数 超过 j 的 ,集合 F(A) 和 F'(4) 是 不 可 能 一 致 的 。 这 里 将 要 说 明 FIRST, (A) CF(4) 是 成 立 的 。 
iix FIRST, (4A) 中 的 一 个 串 。 那 么 存在 一 个 推导 A Sw, 这 里 we X^, HA x EBEN Rw 
前 级 。 根 据 推导 的 归纳 长 度 ， 可 以 得 到 xeF,(4A)。 这 里 主要 包含 了 可 以 从 一 条 规则 推导 出 来 的 终结 
eH, 如果 A—€weP, BRA x RBA ZB F, (A) H 
假设 对 于 V 中 所 有 变量 Astrunci (1w| ASwe X 1) por, Bex e mnc, (IwlA Swe X* 05 
也 就 是 说 ,x 是 通过 应 用 m+1 规则 从 4 推导 出 来 的 终结 符 串 的 前 缀 。 这 里 将 会 证 明 x e Fu (4)。w 
的 推导 可 以 写成 如 下 形式 : 


m 
ADU HH, SK XX, =W, 


其 中 , ue VUEJEH u Sox, ABRIR, AE T PAESE u x, 的 长 度 均 小 于 m+1。 根 据 归纳 假设 ， 通 
过 按 长 度 k 来 截取 x 所 获得 的 串 在 FE。(u) 中 。 

在 第 m+1 个 迭代 中 ，F,,,,(4) 因 为 下 述 集合 而 得 到 增长 : 

trunc, CE, Cu) Fu CH = trance, CF, (i ) E (s) 
因此 ， 
{x} = trunc, (x, CR 

FA xÆ F, a (APIR. MAE FIRST, (A) PRIH F(A) P, E. gu 
19.5 FOLLOW, 集合 的 构造 

引 理 19. 2. 4 中 的 结论 来 自 于 生成 FOLLOW, 集合 的 算法 的 基础 。FOLLOW, 集合 是 从 FIRST, 集 
合 以 及 一 些 规则 构造 出 来 的 ; 其中， 这些 规则 必须 是 那些 4- 出 现在 其 右边 的 规则 。 算法 19:5: 工 通过 


使 用 辅助 集合 FL(4) ^j FOLLOW, (A) 集合 。 集 合 EL'(4) 触 发 停止 状态 ， 并 且 维 护 前 一 个 反复 中 指 
派 给 FL(4) 的 值 。 








算法 19.5.1 

集合 FOLLOW 的 构造 

WA: EPXOGXOGEGZ(V,X,P,S) 
每 个 AeV 的 FIRST, (A) 


1l. FE(S) : 8 4M 
2. for 每 个 4 eV- |S| do FL(A):=@ 
3. repeat 


3.1 for 每 个 4 e V do FL'(A): =FL(A) 
3.2 for 每 个 规则 A—w =u,u,...u, (we X') do 
3:2»T ise BE CA) 
3.2.2 if u, e V then FL(u,): =FL(u,)U L 
3.2.3for i; -n-1 tol do za 
3.2.3.1L: -trunc, (FIRST, (u;,, )L) 
3.2.3.2 if u, e V then FL (yu): -FL(u) UL 
end for 
end for 
until 对 于 任何 AeV 都 有 FL(A) = FL’(A) A vr 
4. FOLLOW,(A): -FL(A) 





加 入 到 声明 3:2:2 AS. 2:2. 2 rf FLCA) HR BS 87038259 fk FOLLOW, 中 ， 这 就 使 得 式 子 FL(4) € 
FOLLOW, (4) 可 以 因此 而 得 到 确定 。 相 反 的 包含 关系 可 以 通过 证 明 FOLLOW, 中 的 每 个 元 素 均 被 加 入 
到 FL(A) 中 ,并 且 FLCA) f£ repeat-until 循环 的 终结 符 前面 来 获得 。 细 节 问 题 留 做 练习 。 
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例 19.5.1 算法 19.5.1 用 于 为 例 19.4. 1 中 的 文法 G 的 每 个 变量 构造 集合 FOLLOW,。repeat - until 
循环 的 内 部 按照 从 右 到 左 的 方式 处 理 每 条 规则 。 循 环 的 动作 是 通过 指派 声明 来 获得 的 ， 这 里 的 指派 声 
明 来 自 于 语法 的 规则 。 








规则 指派 
S—AtHE FL(A) : = FL(A) Utrunc, ( | 8t] FL'(S) ) 
A—aAd FL(A) ; =FL(A) Urtrunc; (|d| FL'(A)) 
A—BC FL(C) ; =FL(C) UFL'(A) 


FL(B) ; = FL( B) Utrunc, (FIRST, ( C) FL'(A) ) 
= FL( B) Utrunc, ( | ad ,ac| FL'(A) ) 
Bebe FL(B) ; = FL( B) U trunc,( |c} FL'(B) ) 


规则 C—acC 在 列表 中 被 忽略 了 ， 这 是 因为 这 条 规则 产生 的 指派 是 FL(C) : =FL(C) UFL'(C)。 跟 踪 
算法 19.5.1 的 生成 结果 显示 如 下 : 


FL(S) FL(A) FL(B) FL(C) 














0 入 | Ø Ø Ø 

1 入 | | 村 Ø Ø 

2 入 | | HH, d#| {ad,ac} [86] 

3 {rt BE dit dd] lad ,ac ,ca| | HE, di | 

4 lA] | 4Ht, dit , dd} | ad ,ac ,ca ,cc| | sHt, dit , dd] 
5 入 | | HE, dit , dd} lad ,ac ,ca ,cc| | 486, dit , dd | 


m 
例 19. 5.2 用 于 文法 G 的 规则 ， 且 长 度 为 二 的 预 读 集合 是 从 FIRST, 集合 和 FOLLOW, 集合 构造 
出 来 的 ， 这 两 个 集合 是 由 例 19. 4. 1 和 例 19. 5. 1 生成 的 。 
LA, ( S—A1Ht) = | ad,bc ,aa ,ab ,bb ,ac| 
LA, (A—aAd) = |aa,ab| 
LA, ( ABC) = | bc,bb,ad,ac} 
LA,(B—bBc) = |bb,bc| 
LA;,(B—4) = {ad,ac,ca,cc} 
LA, ( C—>acC) = {ac} 
LA, ( Cad) = {ad} 
G 是 强 LL(2) 的 ， 这 是 因为 预 读 集合 与 每 对 可 选择 的 规则 是 不 相交 的 。 口 
前 面 讲述 的 算法 为 确定 一 个 文法 是 否 是 强 LL(k) 的 提供 了 判定 步骤 。 上 述 算法 从 使 用 算法 19. 4. 1 
和 算法 19. 5. 1 生成 FIRST, 集合 和 FOLLOW, 集合 开始 。 定 理 19. 2.5 中 介绍 的 技术 就 是 用 于 构造 长 度 
为 天 的 预 读 集合 的 。 根据 定理 19.3.2， 当 且 仅 当 集合 LA,(4 一 zx) 和 LAk(4-':) 与 不 同 的 规则 4 的 每 一 
对 均 不 相交 ,文法 才 是 强 LL(k) 的 。 


19.6 强 LL(1) 文 法 


文法 AE 在 18. 1 节 中 介绍 过 ,该 文法 用 于 生成 包含 惟一 变量 b 的 中 缀 加 法 表达 式 。AE 不 是 强 
LL(k) 的， 因为 它 包含 了 直接 左 递归 规则 4。 本 节 将 会 对 AE 做 出 修改 ， 使 得 其 变 成 强 LL(1) 文 法 ， 
这 样 的 文法 可 以 生成 加 法 表达 式 。 为 了 保证 结果 文法 是 强 LL(1) 的 ， 对 每 个 规则 都 需要 建立 起 长 度 为 
一 的 预 读 集合 。 

转换 是 从 增加 边界 标记 # 到 AE 生成 的 串 上 开始 的 。 这 就 确保 了 预 读 集合 不 会 包含 空 串 ， 文 法 

AE: S—A# 
4 一 了 





£193 LL(k) X 343 





4 一 4 +T 
Tb 
T— (A) [585] 





生成 了 L(AE) 中 的 串 ， 并 加 上 边界 标记 #。 直 接 左 递归 可 以 通过 使 用 4.5 节 中 介绍 的 技术 来 解决 。 变 
E Z 用 来 将 左 递归 转变 成 为 右 递归 ， 生 成 相应 的 文法 AE, o 
AE,: S—>A# 
A—T 
A—>TZ 
Z>+T 
Z * TZ 
Tb 
T— (A) 
AE, 仍然 不 能 是 强 LL(1) 的 ， 这 是 因为 两 个 规则 A 都 将 了 作为 其 右 部 的 第 一 个 符号 。 这 种 困难 是 通过 
使 用 新 的 变量 B 左 提取 规则 4 来 解决 的 。 相 似 地 ， 规 则 Z 的 右 部 以 相同 的 子 串 开 始 。 变 量 了 通过 提取 
规则 Z 来 引入 。AE, 则 是 通过 对 AE, 的 更 改 得 到 的 ，AE, 的 文法 显示 如 下 : 
' AE,; S—A# 
A—TB 
B—Z 
Bo» 
Z TY 
YZ 
Y—nr 
Tb 
T— (A) 
为 了 说 明 AE, 是 强 LL(1) 的 ， BBA, 用 于 文法 的 变量 ,， 且 长 度 为 一 的 预 读 集 合 必须 要 能 够 满足 定理 
19.3.2 的 分 割 情况 。 这 里 从 跟踪 算法 19.4. 1 的 集合 序列 开始 ， 其 中 算法 19. 4. 1 构造 了 FIRST, 集合 ， 
显示 如 下 : 




















F(S) F(A) F(B) F(Z) F(Y) F(T) 
0 [^] Ø IA! o IA] ， Ø 
1 Ø Ø fal 1+] Pp m Ib, 1 
2 Ø 1b,(} PUES {+ IN] { (i 
3 tb, 1b,(} 1dr, +] {+} {Xs +] 1b, Ct 
4 1b,(} Ib. IN, +] 1+} nd 1b, CI 586 
类 似 地 ，FOLLOW, 集合 是 使 用 算法 19.5.1 生成 的 ， 该 集合 显示 如 下 : 
FL(S) FL(A) FL(B) FL(Z) FL(Y) FL(T) 
0 {rt Ø 9 © Ø Ø 
1 IA] {#,)} Ø Ø [7] Ø 
2 {A} {#,)] 1#,)| Ø Ø Ø 
3 IN L2 |#, ) |} 185,1 Ø Ø 
4 IA] {#,) } t#,) | {#,) | {#,) } Ø 
5 IA {|#, ) |} {#,)} [86] 1#,) | {#,) | 
6 {A} {#,) | {#, )} 81 {#,) | 1#,) | 





长 度 为 1 的 预 读 集合 是 从 FIRST, 集合 和 FOLLOW, 集合 得 到 的 ， 结 果 显 示 如 下 : 


344 — X RA 确定 型 语法 分 析 





LA, (SA) = |b,(] 
LA, (A—TB) = |b,(| 
LA, (BZ) 2| «| 
LA, (B2) = {#,) } = 
LA,(Z— * TY) 2| +} 
LA, (YZ) 2| +} 
LA, (YA) = |#,) | 
LA, (T) = {b} 
LA, (T-(A)) = 十 (| 
因为 可 选择 规则 的 预 读 集合 是 不 相交 的 ， 所 以 文法 AE, 是 LL(1) 的 。 


19.7 强 LL(k) 分 析 器 


利用 强 LL(K) 文 法 进行 分 析 ， 需要 从 为 文法 的 每 个 规则 构造 其 预 读 集合 开始 。 一 旦 这 些 集合 创建 
完成 ， 它 们 就 可 以 用 于 分 析 任何 长 度 的 串 。 用 于 分 析 强 LL(k) 文 法 的 策略 将 在 算法 19.7.1 中 介绍 ， 
该 算法 包括 一 个 循环 ， 此 循环 将 预 读 串 和 预 读 集合 进行 比较 ， 并 且 使 用 合适 的 规则 。 

算法 18.2. 1 中 给 出 了 自 项 向 下 分 析 器 中 的 多 种 多 样 的 规则 ， 与 这 些 规则 的 检查 不 同 的 是 ,使 用 
IR LL(k) 文 法 进行 节点 扩张 是 受到 限制 的 ， 也 就 是 说 ， 这 种 情况 最 多 只 能 应 用 一 种 规则 。 预 读 串 和 预 
读 集合 为 消除 无 需 考虑 的 规则 提供 了 充分 的 信息 。 





算法 19.7.1 
用 于 强 LL(k) 文法 的 确定 型 分 析 器 
输入 : IR LL(k) 文法 G- (V, X,P,S) 
FFB pe L’ 
P 中 每 个 规则 的 向 前 集合 LA, (Aw) 
l.q: =S (q is the sentential form to be expanded) 
2. repeat 
W q-uAv, 其 中 4 是 4 最 左边 的 变量 ， 
dtp =uyz ， 其 中 length(y) =k. 
2.1. 对 于 某 个 A MUMIA if y © LA,(A>w)then g : =uwv 
until q= p or 对 所 有 A 规则 有 yz LA, (A—w) 
3. if q =p then 接收 else 拒绝 接收 


文法 中 ， 边界 标记 的 存在 确保 了 预 读 串 y 中 包含 了 个 符号 , 无 论 何 时 ， 只 要 预 读 串 不 是 预 读 集 
合 中 的 一 个 元 素 ， 那么 这 个 输入 串 就 会 被 否决 。 当 预 读 串 在 LA, (Aw) 中 的 时 候 ， 一 个 新 的 句 型 被 
构造 出 来 ， 这 是 通过 应 用 规则 Aw 到 当前 串 uAv 来 实现 的 。 如 果 这 个 规则 的 应 用 生成 了 输入 串 ， 那 
么 这 个 输入 就 会 被 接收 。 和 否则， 为 了 得 到 名 型 wwv， 循 环 就 这 样 反复 地 进行 : 

例 19.7.1 利用 算法 19.7. 1 和 19.6 节 中 介绍 的 强 LL(k) 文法 AE, BUB f A KAT EB (b e b), 
下 表 中 的 每 一 行 均 表示 算法 19.7. 1 中 步骤 2 的 迭代 。 
————————— a NES RURAL a 








u A y 预 读 规则 推导 
入 S 入 ( S—A# S=>A# 

入 4 4 一 TB 一 TB# 

X T Bi ( ESA) 二 (A)B# 
( A ) BH b A—TB —(TB) Bit 
( T: B) Bt b Tb =( bB) B# 
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(4) 
u A v 预 读 规则 推导 
(b B ) BH + B—Zz =>( bZ) BH 
(b Z ) B# 4 Z5 «TY —(b TY) BH 
(b+ T Y) BH b Tb =(b + bY) BH 
(b+b y ) BH ) Y>) =>(b+b) BH 
(b+b) B # # Bh =(b+b)# o 


19.8. LETK) sce 


强 LL(k) 文 法 中 的 预 读 集合 为 选择 规则 提供 了 一 个 全 局 的 标准 。 如 果 A 是 句 型 中 的 最 左 变量 ， 并 
且 这 个 句 型 正在 通过 分 析 而 得 到 扩展 ， 那 么 分 析 器 生成 的 预 读 串 和 预 读 集合 为 选择 合适 的 规则 4 提供 
了 充分 的 信息 。 这 种 选择 并 不 依赖 于 包含 A 的 句 型 。LL(k) 文 法 提供 了 一 个 局 部 选择 标准 ; 选择 哪 条 
规则 是 由 预 读 集合 和 名 型 这 两 者 决定 的 。 

定义 19.8.1 iRG-(V, X, P, S) 是 带 有 边界 标记 # 的 目下 文 无 关 文法 。 如 果 无 论 何 时 必然 
会 存在 两 个 如 下 所 示 的 最 左 推导 


S SuAv —uxv uz, 
S SuAv Suyv >uzw;, 
HH u, w, ze “并且 length(z) =k, 那么 x=y, M] G Æ LL(k). 

注意 定义 19. 3. 1 和 定义 19. 8. 1 中 的 推导 的 区 别 。 强 LL CK) 的 情况 要 求 具有 惟一 的 规则 4， 可 以 
从 任何 包含 4 的 句 型 中 推导 出 预 读 串 z。LL(k) 文 法 只 是 要 求 用 于 固定 句 型 whv 的 规则 是 惟一 的 。 必 
须 为 每 个 句 型 都 定义 LL(K) 文 法 的 预 读 集合 。 

定义 19.8.2 it G- (V, X,P,S) PA iod 的 上 下 文 无 关 文 法 ,并且 uAv 是 G 的 一 个 
名 型 。 

i) 旬 型 uAv 的 预 读 集合 是 由 LA,(uAv) =FIRST,(Av) 定 义 的 。 

i) AB uAv 的 预 读 集合 以 及 规则 A— w 是 由 LA,(uAv,A 一 w) =FIRST,(wv) 定 义 的 。 

上 述 与 定理 19. 3. 2 相似 的 结论 可 以 用 于 建立 LL(k) 文 法 。 对 用 于 句 型 uAv 的 规则 的 惟一 选择 标 
准则 是 要 求 集合 LA,(uAv) 被 规则 A 生成 的 预 读 集合 LA, (uAv,A 一 w) 分 割 。 如 果 文 法 是 强 LL(K) 的 ， 
那么 分 割 就 能 得 到 保证 ， 并 且 语 法 也 是 LL(k) 的 。 

例 19.8.1 LL(k) 文 法 并 不 一 定 是 强 LL(K) 的 。 考 虑 如 下 文法 : 

G,: S—Aabd| cAbcd 
Aa |b| X 
该 文法 的 预 读 集合 在 例 19. 1. 1 中 给 出 。G, 是 强 LL(3) 的 ， 但 不 是 强 LL(2) 的 ， 这 是 因为 串 ab WE 
LA, (4 一”a) 中 ， 也 在 LA, (4 一 入 ) 中 。 用 于 包含 变量 9 和 名 型 4， 并 且 长 度 为 二 的 预 读 集合 显示 如 下 : 
LA,(S,S—4Aabd) = | aa,ba,ab} 
LA, (S,S—cAbcd) = | ca,cb} 


LA,(Aabd,A—4a) = jaa} LA, (cAbed,A—a) = | ab} 
LA, ( Aabd ,A—b) = | ba] LA, ( cAbcd ,A—b) = | bb} 
LA,(Aabd ,A—24) = | ab} LA, (cAbcd,A—») = | be}. 
文法 是 LL(2) 的 ， 这 是 因为 给 定名 型 的 可 选项 是 不 相交 的 。 b] 


i) 19. 8.2 三 个 符号 的 预 读 对 于 文法 规则 的 局 部 选择 来 说 是 充分 的 ， 文 法 显示 如 下 : 
G: S—aBAd |bBbAd 
A—abA |c 
B—-ab |a. 


规则 S 和 4 可 以 使 用 具有 一 个 符号 的 预 读 来 选择 ; 所 以 这 里 可 以 将 注意 力 转 换 到 选择 规则 B 上 去 。 规 
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则 好 的 预 读 集合 显示 如 下 : 
LA, (aBAd,B—ab) = | aba ,abc| 
LA, (aBAd,B—.a) = | aab,acd} 
LA, ( BBbAd,B—ab) = | abb} 
LA, ( bBbAd,B—a) = | aba,abc}. 
8 规则 将 包含 B 的 那 两 个 句 型 的 预 读 集合 进行 分 割 ， 且 该 预 读 集合 的 长 度 为 三 。 因 此 ，G 是 LL(3) 
的 。 强 LL(k) 的 情况 可 以 通过 检查 规则 B. 的 预 读 集合 来 核对 。 
LA( Bab) = ab(ab)* cdUabb( ab) * cd 
LA( Ba) =a(ab) ' cdUab(ab) “cd 
对 于 任何 一 个 整数 k， 存 在 一 个 长 度 大 于 的 串 ， 且 该 串 既 在 LA(B-xab) 中 ,又 在 LA(B->a) 中 。 因 
此 ， 对 于 任何 来 说 ，G 都 不 是 强 LL(K) 的 。 口 
使 用 LL(K) 文 法 进行 确定 型 分 析 要 求 为 分 析 过 程 中 生成 的 句 型 构造 局 部 预 读 集合 。 句 型 的 预 读 集 
合 可 以 从 变量 的 FIRST, 集合 和 文法 终结 符 处 直接 构造 。 给 出 预 读 集合 LA, (uAv,A— w) 如下， 这 里 
wzw,-w,, FFA vav,--v,, UR BTA: 
trunc, ( FIRST, (w, ) -- FIRST, (w,) FIRST, (v, )-:-FIRST,(v,,) ). 
用 于 LL(K) 文 法 的 分 析 算 法 可 以 从 算法 19.7. 1 中 获得 ， 这 是 通过 将 局 部 预 读 集合 加 入 到 构造 中 来 实 
现 的 。 





算法 19. 8.3 
用 于 LL(K) 文 法 的 确定 型 分 析 


FFT pe L’ 

f£fsf A e V fy FIRST, (A) 
logs Ss 
2. repeat 


设 4 =uAv ,其 中 4 是 4 中 最 左边 的 变量 ， 且 
Wp -uyz, HP length (y) =k. 
2. 1. for 为 每 个 规则 A—w 构造 集合 LA, (uAv, A—w) 
2.2. 逊 对 于 某 个 规则 A 有 y ELA, (uAv, Aw) Wz then q : -uwv 
until q =p or 对 于 所 有 A 都 有 y ¢LA, (uAv, Aw) 
3. if 4 =p then 接收 else 拒绝 


IR LL(k) SCRA LL CK) 的 真子 集 。 局 部 预 读 集合 在 选择 合适 规则 的 问题 上 人 允许 使 用 更 多 上 下 文 
有 关 的 信息 。 强 LL( 人 文法 包含 了 变量 A 和 预 读 串 ， 用 以 决定 要 将 哪 条 规则 应 用 于 名 型 ay。 在 LL(k) 
文法 中 ， 分 析 器 生成 的 终结 符 前 缀 也 可 能 用 于 规则 选择 。LL(k) 文 法 并 不 能 产生 所 有 可 以 确定 型 分 
析 的 上 下 文 无 关 语 言 。 练 习 14 给 出 了 一 个 语言 的 例子 ， 这 种 语言 可 以 通过 确定 型 下 推 自动 机 来 分 析 ， 
但 该 语言 并 不 是 由 LL() 文 法 生成 的 。 


19.9 练习 


1. 设 G 是 上 下 文 无 关 文 法 ， 开始 符号 为 5$。 证明 LA(S) =L(G) 。 
2. 给 出 下 列 文法 中 每 个 变量 的 预 读 集合 。 
a) S—ABab |bAcc b) SaS|A 
Aa|c _ Aab|b 
B—b|c|X 
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c) S—AB | ab d) S—aAbBc 
A—4A | X A—aA |cA | X 
B—bB|X B—bBc | bc 

- 给 出 下 列 文法 中 每 个 变量 的 FIRST, 集合 和 FOLLOW, 集合 ， 哪 些 文法 是 LL(1) 的 ? 

a) S—aAB# b) S—AB# 
Aa | X A—aAb | B 
B—b| X B—aBc | X 

c) S—ABC# d) SeaAd& 
A—aA | X 4 一 BCD 
B—bBc | X B—bB|Xx 
C—«À | dB| X C—cC| A 

D—bD | 入 


. 给 出 可 以 生成 下 述 语言 的 强 LL(1) 文 法 。 


a) {a'bic'|i=0, jz0| 
b) | a‘b’c| iz1, j=0| 


. 证 明文 法 


S—aSa |bSb | 入 
是 强 LL(2) 的 , 但 不 是 强 LL(1) 的 。 


. 利用 算法 19. 4. 1 和 算法 19. 5. 1 为 下 述 文法 的 变量 构造 FIRST, 集 和 FOLLOW, 集 。 这 些 文法 是 强 LL(2) 


的 吗 ? 

a) S—ABC## b) S—4AtBt 
A—aA |a A—BBA |BcAa | 
B—bB | 入 B—acB |b 
C—cC |a | b |c 


. 证 明 引 理 19.2.2 中 的 3、4 和 5 部 分 。 
“8. 证 明定 理 19. 3.3。 


. 证 明 下 述 文法 对 于 任何 大 来 说 都 不 是 强 LL(k) 的 。 构 造 一 个 可 以 由 该 语法 生成 的 语言 的 确定 型 PDA。 
a) SaSb |A b) $—4A |B 
A—aAc | 入 A—aAb lab 
B—aBc |ac 
c) SA 
A-aAb |B 
B—aB |a 


证 明 算 法 19. 5. 1 可 以 生成 FOLLOW(4) 集 。 
对 下 述 给 出 的 文法 进行 修改 ， 使 得 其 可 以 称 为 等 价 的 强 LL(1) 文 法。 建立 预 读 集合 ， 以 保证 修改 后 的 
语法 是 强 LL(1) 的 。 


a) SA b) S—aA# | abB# | abcC# 

A—aB | Ab | Ac A—4aA | X 

B—bBc | X B—bB|X 

C—cC| X 
. 利用 LL(1) 分 析 和 AE, 文法 分 析 下 述 串 。 使 用 例 19.7. 1 的 格式 来 跟踪 分 析 的 动作 。AE, 的 预 读 集合 在 

19. 6 节 中 给 出 。 y 
a) b+(b)# 
b) ((b))# 
c) b+b+b# 


d) b+ +b# 
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13. 为 文法 规则 构造 预 读 集合 。 若 使 文法 是 强 LL(k) 的 ， BAR) kB? 为 每 个 句 型 合并 和 规则 构 
造 预 读 集合 。 若 使 文法 是 LL(K) 的 ， 那么 最 小 的 值 是 多 少 ? 


a) $—4aAcaa | bAbcc b) S—aAbc | bABbd 
Aa | ab| X A—a| A 
Ba|b 
c) S—aADB | bAbA 
A—ab | a 
B—aB | b 


“14. VEWLAS TEE LLO GE, ETER TE 


L= |da |i=0} U lab li=0}. 
设计 一 个 可 以 接收 LL 的 确定 型 下 推 自 动机 。 


"15. 证 明文 法 是 强 LL(1) 的 ， 当 且 仅 当 它 是 LL(1) 的 。 


16. 证 明 上 下 文 无 关 文 法 G 是 LLCK) 的 ， 当 且 仅 当 ， 对 于 每 个 句 型 av 来 说 ， 预 读 集合 LA:(Av) 均 被 集合 
LA, ( udAv, A—w,) 分 割 。 


参考 文献 注释 


使 用 LL(k) 文 法 进行 分 析 是 由 Lewis 和 Stearns [1968] 首先 提出 来 的 。Rosenkrantz 和 Stearns 
[1970] 进一步 发 展 了 LL( 有 文法 和 确定 型 分 析 。Aho 和 Ullman [1973] 又 检验 了 LL(k) 语 言 和 其 他 
类 能 够 被 确定 型 分 析 的 语言 之 间 的 联系 。Kuki-Suonio [1969] 提出 了 LL(k) 分 层 。Foster [1968], 
Wood [1969]. Stearns [1971] 以 及 Soisalon-Soininen 和 Ukkonen [1979] 引 和 更改 文法 的 技术 ， 使 
得 更 改 后 的 文法 可 以 满足 LL(k) 或 者 强 LL(k) 的 环境 。 

为 由 ELL(1) 文 法 定义 的 语言 建立 编译 器 通常 都 会 使 用 递归 方法 。 这 种 方法 允许 机 器 代码 的 生成 附 
带 语法 分 析 。 关 于 语法 分 析 的 一 个 全 方位 的 引 论 和 编译 可 以 在 Aho, Sethi 和 Ullman [1986] 中 找到 。 
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自 底 向 上 的 分 析 器 生成 了 移 进 和 归 约 序列 ， 这 样 可 以 将 输入 串 归 约 到 文法 的 开始 符号 。 确 定型 的 
分 析 器 必须 要 能 够 在 此 过 程 中 合成 附加 的 信息 ， 以 便于 在 有 多 种 可 能 性 共同 存在 的 情况 下 做 出 正确 的 
选择 。 如 果 一 个 具有 上 个 符号 的 预 读 集合 可 以 提供 足够 的 信息 以 便于 做 出 选择 ,那么 这 个 文法 就 是 
LR(k) 文 法 。LR 表示 这 些 串 是 按照 从 左 到 右 的 方式 进行 分 析 的 ， 这 样 就 构成 了 一 个 最 右 推导 。 
LR(k) 文 法 在 理论 上 是 具有 很 重要 的 意义 的 ， 这 是 因为 对 于 每 一 种 可 以 被 确定 型 分 析 的 上 下 文 无 关 语 
言 来 说 ， 按 照 从 左 到 右 的 方式 读 和 一 个 输入 串 是 由 LR(K) 文 法 生成 的 。 而 对 于 应 用 上 的 意义 来 说 ， 
LR 方式 可 以 为 自 底 向 上 的 分 析 发 生 器 提供 基础 ， 程 序 将 会 自动 地 直接 从 文法 规则 生成 分 析 器 。 

本 章 中 所 有 的 推导 都 是 最 右 推导 。 这 里 假设 文法 的 开始 符号 是 非 递归 的 ， 并 且 文 法 里 所 有 的 符号 
都 是 有 用 的 。 


20 1  LR(OJ TRE 


确定 型 的 自 底 向 上 分 析 器 尝试 将 输入 串 归 约 成 文法 的 开始 符号 。 非 确定 型 的 自 底 向 上 分 析 器 是 通 
过 对 下 述 文法 中 检查 串 aabb 的 归 约 来 阐明 的 
G: S—aAb | BaAa 
A—ab| b 
B—Bb | b. 
分 析 器 在 找到 一 个 归 约 子 串 前 会 扫描 前 缀 aab. aab 的 后 级 b I ab 构造 出 了 文 规则 归 约 
法 G 的 规则 的 右 部 。aabb 的 三 个 归 约 可 以 通过 移 进 这 些 子 串 来 获得 。 a Ree 


自 底 向 上 分 析 器 的 目标 是 对 输入 串 进行 重复 归 约 ， 直 到 获得 了 开始 符号 。 es 2 
那么 利用 规则 Ab 进行 初始 化 的 aabb 的 一 个 归 约 是 否 最 终 就 会 生成 开始 符号 
呢 ? 同 样 地 ，aahb 是 G 的 右 句 型 吗 ? 文法 G 的 最 右 推导 具有 如 下 形式 : oP os : 尼 且 
S—aAb-aabb 
S—aAb-abb 


S=BaAa=Baaba —Bb'aaba-»bb'aaba i>0 
S=BaAa=>Baba Bb'aba—bb'aba i>0. 
L(CG) 中 的 串 的 成 功 推 导 可 以 通过 在 前 述 推导 中 “逆向 箭头 ”来 实现 。 因 为 串 aahb 和 aaBb 并 没有 发 
生 在 这 些 推导 中 ， 所 以 串 aabb 通过 使 用 规则 4 一 b 或 者 规则 8 一 b 进行 初始 化 的 归 约 是 不 能 够 成 生 5 
的 。 利 用 这 些 附加 的 信息 ， 分 析 器 只 是 需要 通过 规则 A—ab 归 约 出 aab 即 可 。 
成 功 的 归 约 是 通过 检验 文法 G 的 最 右 推导 来 获得 的 。 如 果 分 析 器 不 进行 预 读 , 那么 这 样 的 分 析 器 
就 必须 要 能 够 确定 是 否 应 该 在 扫描 到 uw 的 时 候 就 要 利用 规则 A 一 w 来 实现 一 个 归 约 。 下 面 将 要 介绍 
规则 Aw 的 LR(0) 上 下 文集 合 ， 它 定义 了 一 种 在 w 被 扫描 器 读 到 的 时 候 就 需要 执行 归 约 的 上 下 文 。 
定义 20.1.1 设 G=(V, 且 ,P,S) 是 上 下 文 无 关 文 法 。 如 果 存 在 如 下 的 推导 : 
| S =>uAv uw, 
那么 串 uw 是 规则 Aw #9 LR(O).E TF x, i Vue(VUX)' 3E ueX', MM A—w $5 LR(O) EF 
文集 合 是 用 LR(0) - CONTEXT( A—w) 来 表示 的 。 
规则 A—w 的 LR(O) 上 下 文 是 通过 最 右 推 导 来 获得 的 ， 最 右 推 导 是 在 应 用 该 规则 的 时 候 终止 的 。 
对 于 归 约 来 说 ， 如 果 串 uwv 可 以 归 约 到 $， 并 且 这 个 归 约 是 从 利用 4 BAR w JF R9, ABA uw 是 规则 
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4 一 的 LR(0) 上 下 文 。 如 果 uw e LR(0) -CONTEXT (4 一 w) ， 则 不 存在 这 样 一 个 归 约 序列 ， 该 归 约 
序列 以 规则 Aw 为 起 点 ， 并 且 形 如 uwv 的 串 利用 该 规则 生成 5S， 这 里 ve " 。 如 果 知 晓 了 LR(O) 的 
上 下 文 ， 那么 就 可 以 使 用 该 上 下 文 从 而 利用 分 析 器 来 消除 归 约 。 当 uw 是 规则 A— w 的 LR(0) 上 下 文 
的 时 候 ， 分 析 器 只 需要 使 用 规则 A— w 来 归 约 uw. 
规则 G 的 LR(0) 上 下 文 是 由 G 的 最 右 推导 构造 出 来 的 。 为 了 确定 规则 S—aAb 的 LRCO) EFX, 
这 里 考虑 所 有 包含 应 用 规则 的 最 右 推导 。 惟 一 的 两 个 推导 显示 如 下 : 
S—aAb-»aabb 
S—aAb-»abb. 
惟一 的 终止 于 规则 S aA 的 最 右 推导 是 5=>ah4b。 因 此 , 则 LR(0) - CONTEXT( S—aAb) = | aAb} 成立 。 
规则 4ab 的 LR(0) 上 下 文 是 通过 应 用 规则 4 一 *ab 而 终止 的 最 右 推导 来 获得 的 。 只 有 两 个 这 样 的 
推导 存在 。 归 约 是 通过 ab 到 A 的 箭头 来 表示 的 。 上 下 文 是 到 达 此 句 型 的 前 缀 ， 并 且 包 括 已 经 归 约 的 
ab 的 发 生 。 


S = aAb = aabb 


S => BaAa => Baaba 
因此 ， 规 则 A—ab 的 LR(0) 上 下 文 是 aab 和 Baab。 对 于 G 中 所 有 的 规则 ， 可 以 采用 相应 的 方式 获得 
其 LR(0) 上 下 文 。 





AN — ë Ra 
S—aAb | aAb} 
S—BaAa | BaAa| 
A—ab | aab , Baab| 
A—b | ab, Bab} 
B—Bb | Bb} 
B—b 1b} 


例 20.1.1 为 下 述 文法 的 规则 构造 LR(0) 上 下 文 
S—aA | bB 
A—abA | bB 
B—.bBc | bc. 
利用 规则 S— aA 进行 初始 化 的 最 右 推 导 具 有 如 下 形式 
S—aA Sa(ab)'A a(ab)'bB 5 a( ab)‘bb! Bc.— a(ab)'bb! bec’ , 
其 中 心 j>0, MAU SB 开始 进行 的 推导 如 下 所 示 : 





S=bB —bb/ Bc' bb bcc". 
LR(0) 的 上 下 文 可 以 从 上 述 推导 生成 的 句 型 中 获得 。 
规则 - LR(0) 上 下 文 
$—4aA {aA} 
S—bB | bB| 
A—abA la (ab)'A |i>0} 
A—bB |a (ab)'bB |iz0| 
B—bBc d la (ab)'bbiBc, bbiBc|i=0, j>0} 
B—bc la (ab)‘bbic, bbic| iz0, j>0} 口 


上 下 文 可 以 用 来 消除 分 析 器 生成 的 归 约 。 当 LR(0) 上 下 文 提供 了 足够 的 信息 ， 从 而 可 以 消除 所 有 
的 动作 ， 而 只 留 下 一 个 动作 的 时 候 ， 这 个 文法 就 被 称 为 LR(0) 文 法 。 
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定义 20.1.2 de X53LT4—^uce(VUE)', 并 且 v e X' Kit, 

ue LR(0) - CONTEXT(A—w,) , 并 且 uv eLR(0) - CONTEXT( B—w, ) 
这 也 就 是 说 , v=, A=B, ŽE wj =w,。 那么 具有 非 递 归 开 始 符号 8 的 上 下 文 无 关 文 法 G=(V, 二 ， 
P,S) x LR(0) 4. 

i) 20. 1. 1 中 的 文法 是 LR(O) AY. dt LR(0) 上 下 文 的 表 ， 可 以 看 出 不 存在 某 个 规则 的 LR(O) 上 
下 文 是 另外 某 个 规则 的 LR(0) 的 前 级 。 

LR(0) 文 法 上 下 文 为 选择 合适 的 动作 提供 了 所 需 的 信息 。 当 扫描 串 u 的 时 候 ， 分 析 器 选择 了 以 下 
三 种 彼此 独立 的 动作 中 的 一 种 : 

1. 如 果 ueLR(0) - CONTEXT(A—w) , ABA u 使 用 规则 Aw 进行 归 约 。 

2. WR u AZE LR(O) 上下文， 但 却 是 某 个 LR(0) 上下文 的 前 缀 ， 那 么 分 析 器 会 产生 一 个 移 进 。 

3. 如 果 不是 任何 LR(0) 上 下 文 的 前 级 ， 那 么 输入 串 将 会 被 拒绝 。 
AA u 是 至 多 一 条 规则 Aw 的 LR(0) 上下文， 所 以 第 一 种 情况 就 指明 了 惟一 的 动作 。 如 果 存 
EB ve(VUL)* ,wELR(O) EF XW, BAR u RHA EAA (viable prefix), WIR u Ji ih 
前 级 ， 并 且 不 是 LR(0) 上 下 文 的 ， 那 么 一 个 移 进 操作 序列 可 以 生成 LR(0) 上 下 文 uvo 


例 20.1.2 文法 规则 LR(0) 上 下 文 
G: S—aA | aB S—aA {aA} 
A—aAb | b S—aB [aB] 

| B—>bBa | b " A—aAb | ad Ab |i » 0| 
不 是 LR(0) 的 。 对 于 任意 i=0，G 的 最 右 推导 具有 如 下 形式 : À 

D E TNS A—b | aa!b |iz0| 
3 一 04 p Ab —aa bb B—bBa labiBa | i50] 
S—aB —ab' Ba'—ab' ba Bb lab! |i 0] 


该 文法 规则 的 LRCO) 上 下 文 可 以 通过 上 述 推导 的 右 句 型 获得 。 -MO ous 
文法 G 不 是 LR(0) 的 ， 这 是 因为 ab 是 一 个 包含 规则 Bb 并 且 包 含 规则 Ab RS LR(O) EFX O 


20. 2 LR(0) 分析 器 


将 LR(0) 文 法 规则 的 LR(0) 上 下 文 提 供 的 信息 合成 到 自 底 向 上 分 析 器 中 将 会 产生 确定 型 的 分 析 算 
E. mAP p 是 按照 从 左 到 右 的 方式 进行 扫描 的 。 算 法 20. 2. 1 中 的 分 析 器 的 动作 是 通过 将 LR(0) 上 
下 文 和 扫描 的 串 相 比较 来 确定 的 。 串 是 被 分 析 器 扫描 的 句 型 的 前 级 ，v 是 输入 串 的 余下 部 分 。 操 作 
shift(w,v) 将 第 一 个 符号 从 v 中 移 除 ， 并 将 它 连接 到 u 的 右 端 。 


算法 20. 2.1 
LR(0) 文 法 的 分 析 器 
输入 ; LR(0) XÆ G-(V,X,P,S) 
FRB p ey” 
lous X, v: =p 
. 2. dead - end; c false 
3. repeat 
3.1. 证 对 于 己 中 的 规则 4 一 w 有 2 eLR(0) - CONTEXT(A-—w) 
其 中 u =xw then u : =xA 
else if u 是 变量 前 缀 上 且 v Æ AKA shift (u,v) 
else dead-end: = true 
until u = S or dead - end 


4.ifu = S then 接收 else 拒绝 

















如 果 遇 到 子 串 上 =xw 就 要 利用 规则 Aw 进行 归 约 。 做 出 此 决定 不 需要 使 用 v 中 包含 的 任何 信息 ， 
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v 是 串 中 未 被 扫描 的 部 分 。 分 析 器 并 不 预先 读 取 串 mw， 这样 LR(0) 中 的 零 就 表示 不 需要 进行 预先 读 取 。 
算法 20.2.1 忽略 了 一 个 细节 。 该 算法 没有 提供 可 以 确定 一 个 串 是 活 前 绥 还 是 文法 规则 的 LR(0) 上 
下 文 的 技术 。 在 下 一 节 中 ,我们 将 会 设计 一 种 有 限 自动 机 ， 该 有 限 自动 机 的 计算 可 以 确定 LR(O) 的 上 
下 文 和 活 前 缀 。 
例 20.2.1 B aabbbbcc 是 通过 使 用 例 20.1.1 中 的 文法 的 规则 和 LR(0) 上 下 文 以 及 用 于 LR(0) 文 





法 的 算法 来 进行 分 析 的 。 
u v 规则 行为 
X aabbbbcc 转移 
a abbbbcc 转移 
aa bbbbcc 转移 
aab bbbcc 转移 
aabb bbcc 转移 
aabbb bcc 转移 
aabbbb cc 转移 
aabbbbc c B—bc 归 约 
aabbbB c 转移 
aabbbBc 入 B—bBc 归 约 
aabbB À 4 一 5B 归 约 
aabA 入 A—>abA JAH 
aA 入 S—aA 归 约 
S L1 





20.3 LR(0) 机 


为 了 选择 合适 的 动作 ，LR(0) 分 析 器 将 处 理 的 串 u 与 文法 规则 的 LR(0) 上 下 文 相 比较 。 因 为 规则 
的 LR(0) 上 下 文集 合 可 以 包含 无 穷 多 的 串 ， 而 且 集合 中 的 串 可 以 任意 长 ， 这 里 下 能 生成 这 些 集 谷 从 而 
直接 进行 比较 。 处 理 无 穷 集合 的 问题 可 以 在 LR() 文 法 中 得 以 避免 ， 这 是 通过 限制 预 读 串 长 度 的 方式 
来 实现 的 。 令 人 遗憾 的 是 ， 对 串 进行 归 约 的 决定 要 求知 晓 整 个 串 〈 上 下 文 ) 的 扫描 过 程 。LR(0) 文法 
G, 和 G, 可 以 演示 这 种 依赖 关系 。 








文法 G, 的 规则 A—aAb 和 规则 4->*og 的 LR(O) 上 下 文 ”规则 CLR) ERR 
形成 了 不 相交 集合 ， 这 些 不 相交 集合 可 以 满足 前 缀 的 情况 。 G1: SoA [A] 
如 果 这 些 集合 被 截 成 任意 长 度 上 ， 那 么 串 ah 将 会 是 这 两 个 poset [alas Sot 
截取 集合 中 的 元 素 。 上 下 文 的 最 后 两 个 符号 需要 用 来 区 别 Muy. 
这 些 归 约 。 pot 
可 能 有 的 读者 只 是 考虑 了 上 下 文 的 定 长 后 缀 的 情况 ， Ar . lebli»ol — — 
这 是 因为 归 约 会 更 改 扫描 串 的 后 级 。 文 法 G, 可 以 显示 出 
这 种 方法 的 不 可 用 性 。 
规则 A—ab 和 规则 Bab 的 LR(0) 上 下 文 的 惟一 不 同 规则 LR(0) 上 下 文 
就 是 串 中 的 第 一 个 元 素 。 如 果 选 择 的 过 程 只 是 使 用 LR(0) O: SLA lA] 
上 下 文 的 定 长 中 缀 ,那么 分 析 器 将 不 能 区 别 这 些 规则 。 mi ne 


文法 G 和 G, 演示 了 LR(O) 分 析 器 需要 整个 扫描 串 来 


4 一 aA | i>0} 
选择 合适 的 动作 。 令 人 遗 估 的 是 ， 这 并 不 是 说 需要 整个 S. o 
LR(0) 上 下 文集 合 。 对 于 一 个 给 定 的 文法 ， 可 以 构造 一 个 Ac Idol kap 
有 限 自动 机 ， 该 有 限 自 动机 的 计算 可 以 确定 某 个 串 是 否 是 要 上 


文法 的 活 前 缀 。 该 机 的 状态 被 称 为 LR(0) 项 ， 可 以 直接 从 B—ab | ba'b | i50] 
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文法 规则 构造 该 机 。 

3EX.20.3.1. 4 G=(V,},P,S) 是 上 下 文 无 关 文 法 。G 的 LR(0) 项 可 以 进行 如 下 定义 : 

i) taR A—uv e P, IWA Au. v X LR(0) is 

ii) 如 果 A—AcP, AAA. X LR(0)À 

LR(0) 项 可 以 从 文法 的 规则 中 获得 ， 这 是 通过 在 规则 的 右边 放置 一 个 标记 “. ”来 实现 的 。 项 
“A 一 u. ”被 称 为 完全 项 (complete item) 。 对 于 一 个 右 部 长 度 为 n 的 规则 可 以 生成 n+1 个 项 ， 从 而 用 
于 标记 的 每 一 个 可 能 的 位 置 。 

定义 20.3.2 设 G=(V, 了 有 ,P,S) 是 上 下 文 无 关 文 法 。G 的 非 确定 型 LR(0) 机 ( nondeter ministic 
LR(0) machine) 是 NFA - AM - (Q,VUZ,8,q),Q), iX € QE. qo 开始 增 大 的 LR(0) 项 集合 。 状 
态 转换 函数 定义 如 下 : 

i) 6(q,A) ={S—. wIS—weP] 

ii) 8(A—u. av,a) = | A—ua. v} 

iii) 6(A—u. Bv,B) = | A—uB. v} 

iv) 6(A—u. Bv,A) = |B. wIB>weP}. 

对 于 是 文法 的 活 前 绥 的 串 来 说 ， 文 法 G 的 非 确 定型 LR(0) 机 M 的 计算 完全 可 以 处 理 这 样 的 串 。 
所 有 其 他 的 计算 在 读 人 整个 输入 之 前 就 停止 了 。 因 为 M 的 所 有 状态 都 被 接收 ， 所 以 M 正好 接收 以 前 
文法 的 所 有 的 活 前 级 。M 的 计算 记录 了 为 匹配 文法 G 的 规则 的 右 部 而 做 出 了 进展 。 项 Au. v 则 表示 
TRu 已 经 被 扫描 了 ， 并 且 自 动机 正在 寻找 串 "来 完成 匹配 。 

在 项 中 ， 跟 在 标记 之 后 的 符号 定义 了 从 一 个 节点 出 来 的 弧 。 如 果 标 记 在 终结 符 之 前 ， 那 么 从 节点 
出 来 的 惟一 的 弧 就 用 那个 终结 符 来 标记 。 标 记 的 弧 B 或 者 A 可 能 在 从 节点 出 来 的 时 候 包 含 了 具有 形式 
Au. Bv 的 项 。 为 了 扩展 规则 的 右 部 匹配 ， 该 机 会 寻找 一 个 B。 如 果 分 析 器 读 到 了 B， 那 么 节点 4 一 
uB. v 就 被 插入 进来 。 除 此 之 外 ， 还 要 寻找 可 以 生成 B 的 串 。 变 量 B 可 以 通过 使 用 一 个 规则 B 的 归 约 
来 获得 。 这 样 ， 分 析 器 也 寻找 规则 B 的 右 部 。 这 是 通过 对 项 B. w 进行 -状态 转换 来 实现 的 。 

在 定义 20.3.2 中 , 下 表 中 给 出 的 LR(0) 项 ， 以 及 文法 G 的 规则 的 LR(0) 上 下 文 ， 从 而 来 演示 活 
前 缀 的 识别 ， 而 这 是 通过 使 用 相应 的 NFA -入 来 实现 的 。 


规则 LR(0) 项 LR(0) 上 下 文 
S—AB S—. AB {AB} 

S—A. B 

SAB. 
A—4Aa A—. Aa | Aa} 

4 一 4. a 

A—Aa. 





A—a A—.a {a} 
A—a. 

B—bBa B—. bBa | Ab Ba | i50] 
B—b. Ba 
B—bB.a 
B--+bBa. 

B—ba B—. ba | Ab‘ba | i>0} 
Bb. a 
B-ba. 


图 20-1 中 给 出 的 NFA -是 文法 G 的 LR(0) 机 。 如 果 Au ve d(q.w), ARAB w 是 规则 A—uv 
的 上 下 文 的 前 级 。 图 20-1 中 的 LR(0) 机 的 计算 在 遇 到 包含 项 A—A. a, SA. B, B. bBa 和 B—. ba 的 
时 候 停机 。 这 些 正好 是 具有 从 4 开始 的 LR(0) 上下文 的 规则 。 同 样 地 ， 具 有 输入 ADB 的 计算 显示 了 
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ADB 是 规则 B—bBa 的 活 前 缀 ， 除 此 之 外 ， 再 无 其 他 。 i 
第 5 章 中 介绍 的 技术 可 以 用 于 构造 G 的 非 确定 型 LR(0) 机 的 一 个 等 价 的 DFA。 图 20-2 描述 了 该 
机 ， 即 G 的 确定 型 LR(0) 机 (deterministic LR(0) machine) 。 确 定型 机 的 开始 状态 q, 是 qu 的 入 - 闭 包 ， 


qo 是 非 确定 型 机 的 初 态 。 空 集 代表 失 败 状 态 ， 在 这 里 被 省 略 。 当 处 理 串 去 的 计算 成 功 终止 的 时 候 ，z 
即 是 LR(0) 上 下 文 或 者 活 前 级 。 算 法 20.3.3 将 LR(0) 机 的 信息 合成 进 了 LR(0) 分 析 策 略 中 。 





图 20-1 G 的 非 确 定型 LR(0) 机 





20-2 G 的 确定 型 LR(0) 机 
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Bik 20. 3.3 
使 用 确定 型 LR(0) 机 的 分 析 器 


输入 : LR(0) 文 法 G=(V, 工 ,P,S) 
FAB p eZ" 
G 的 确定 型 LR(0) 机 器 
Lan——X-v:-—-p 
2. dead - end; = false 
3. repeat 
3. 1. if 8(q,,u) fj & A—w, FLA u 2 xw then u: - xA 
else if 8(q,,u) 包含 一 个 项 Ay. z , H. v¥ then 转移 (u,v) 
else dead - end: = true 
until u = S or dead — end 
4. if u = S then 接收 else 拒绝 








步 又 3. 1 用 于 确定 要 采用 哪 种 动作 ， 这 是 基于 LR(0) 机 计算 8 (4, u) 的 结果 。 如 果 8 (g,,u) ae 
了 一 个 完全 LR(0) 项 4A-w. , 那么 就 要 进行 使 用 规则 Aw 进行 的 归 约 ， 循 环 就 重复 进行 以 得 到 结果 
P, WME 6(g,,u) 包 含 了 LR(0) 项 4 一 y.z， 那么 就 要 执行 一 个 转换 函数 来 扩展 活 前 级 的 匹配 。 最 后 ， 
如 果 $( gq,,u) 为 空 ， 那 么 计算 停止 。 

例 20.3.1 Æ uabbaa 使 用 算法 20.3.3 和 图 20 -2 中 的 确定 型 的 LR(0) 机 来 分 析 。 当 处 理 第 一 个 
a 的 时 候 ， 该 机 进入 状态 Aa. ， 使 用 规则 Aa RRENA, AA 68( gq,,A) 不 包含 完全 项 ， 所 以 分 析 
器 进行 移 进 并 且 构 造 串 ha。 计算 8(q,,Aa) = | A—Aa. | 表示 了 4a 是 4-4a 的 LR(O) EFX, FAR 


是 其 他 任何 规则 的 上 下 文 的 前 级 。 在 生成 了 一 个 完全 项 以 后 ,分 析 器 使 用 规则 A—Aa 来 归 约 串 。 移 进 
和 归 约 循环 持续 进行 ， 直 到 名 型 已 经 被 归 约 为 开始 符号 So 口 
u v 计算 行为 
X aabbaa ô (q, N = {5—» AB, 移动 
A—.a, 
A—. Aa} 
a abbaa 8 (ved) = |A—a. | 归 约 
A abbaa 8 gis A) = 14 一 4. a, 移动 
SA. B, 
B—. bBa, 
B—. ba} 
Aa bbaa 8 (q,, Aa) = [A—4Aa. | 归 约 
A bbaa 8 (a, A) = [A—4A. a, 移动 
S—4A. B, 
B—. bBa, 
B—. ba} 
Ab baa 8 (q,, Ab) = | B. bBa, 移动 “ 
B—»b. Ba, 
B—. ba, 
B—b. a} 
Abb aa 8 (q,, Abb) = | B—. bBa, 移动 
B—»b. Ba, 


B—. ba, 
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(5X) 
u v 计算 行为 
B—b. a} 
Abba a 8(4,, Abba) = [B—ba. | 归 约 
AbB a 8(q,, AbB) = | BB. a} 移动 
AbBa 入 8(4,, AbBa) = | B—bBa. | HZ 
AB A 8(q,, AB) = [S—4AB. | 归 约 


20.4 被 LR(0) 机 接收 


构造 LR(0) 机 用 于 确定 串 是 否 是 文法 的 活 前 级 。 定 理 20.4.1 建立 了 LR(0) 机 的 计算 , 用 以 提供 
所 需要 的 信息 。 
定理 20.4.1 设 G 是 上 下 文 无 关 文法 ，M 是 G 的 非 确定 型 LR(0) 机 。LR(0) 项 4A_wuv 在 5(g,,w) 
中 ， 当 且 仅 当 w=pu， 这 里 puv 是 Aw $ LR(O) EFX, 
证 明 : i Au. v 是 6(gq,,w) 的 元 素 。 通 过 对 计算 8(gq,,w) 中 的 状态 转换 数 进行 归纳 证 明 ， 可 以 
得 出 ww 是 A-—w 的 LR(0) 上 下 文 。 
归纳 基础 包含 了 计算 长 度 为 一 的 情况 。 所 有 这 样 的 计算 都 具有 如 下 形式 : 
其 中 Sq 是 文法 的 一 个 规则 。 这 些 计算 处 理 输入 串 w 2A. 设置 p = 入 、 入 
u-XBiv-q AT wif Hif. (4) ina 
现在 , Ub 8(qu,w)J& 8(q, w) PA Au. v BRE k 5 1 的 计算 。 将 最 后 一 个 转换 隔离 开 ， 我 们 
可 以 将 计算 写成 6($(go,y) x), 其 中 w=yx, JEHxeVU XU 1A|。 证 明 的 余下 部 分 被 分 成 下 面 几 
种 情况 。 
情况 1: xeV 。 在 这 种 情况 中 ，u =u'a。 计 算 的 最 后 转换 具有 如 下 形式 
根据 归纳 假设 ，pu'av = wv fe A—uv 的 LR(0) 上 下 文 。 iN a Tem 
情况 2: 证 明 类 似 情况 1。 — 
情况 3: xz, WR x-A, 那么 y=w， 并 且 计 算 在 项 B—rAs 处 终止 。 最 终 转换 具有 如 下 形式 : 
归纳 假设 暗示 了 w 可 以 写成 w=pr， 3X Hi prAs 是 B—rAs 的 LR(0) X 
上 下 文 。 这 样 ， 就 存在 一 个 最 右 推导 ， 形 式 如 下 所 示 ; deii Em 
S =>pBq =pråsq. 
对 规则 Av 的 应 用 生成 了 
S =>pBq => prAsq =>prvsq. 
这 个 推导 的 最 终 步骤 表明 了 pm = wv Æ Av 的 LR(0) 上 下 文 。 
为 了 确立 对 等 的 含义 ， 必 须要 证 明 不 管 何 时 ， 只 要 puv 是 规则 A— uv 的 LR(0) EFX, JA 
8 (a, Pe) RASH Au. v, 首先 ， 需 要 标记 出 ， 如 果 6( qo,p) 包 含 了 A 一 . wv， 那么 6( qo,w) 包 含 
了 规则 A—. uw。 这 是 紧 随 在 定义 20. 3. 2 中 的 情况 (i) 和 (ui) 之 后 的 。 
因为 puv 是 A—uv ff] LR(O) 上 下 文 ,那么 存在 一 个 如 下 所 示 的 推导 
S=>pAq =>puvq. 
通过 对 推导 S 的 长 度 进行 归纳 ,可 以 证 明 8 (qop) EE A. ww。 归纳 基础 对 长 度 为 一 的 情况 进 
行 推导 ， 即 $ 人 一 p4g。 所 要 求 的 计算 需要 能 够 遍历 处 理 串 p 的 过 程 中 ， 能 够 到 达 S—. pAg 的 那些 弧 。 计 
算是 通过 跟踪 从 Sp. Aq 到 A—. uv 的 入 - 弧 来 完成 的 。 
现在 ， 考 虑 变量 A 出 现在 第 gr tla 这 种 形式 的 推导 可 以 写成 如 下 形式 
S SxBy => xwAzy. 


这 种 归纳 假设 声明 了 (gq,x) 包 含 了 项 B->.wAz。 因 此 Bow. 4ze8(q,zw)。 和 -状态 转换 到 A. uv 
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以 完成 这 个 计算 。 E 
在 引 理 20. 4. 2 中 ， 上 下 文 无 关 文法 中 的 推导 和 文法 的 确定 型 LR(0) 机 中 的 节点 的 项 之 间 的 关系 
紧 随 引 理 20.4. 1。 引 理 20. 4. 2 的 证 明 留 做 练习 。g, 是 确定 型 机 的 开始 符号 。 
引 理 20.4.2 设 M 是 上 下 文 无 关 文法 G 的 确定 型 LR(0) 机 。 假 设 (q, w) EATA Au. Bv, 


i) PRBS, MAYTE CEV R, lg ,mw) 包 含 了 具有 形式 C _ 的 项 。 


i) 如 果 互 =>xe 忆 +， 那么 对 于 某 些 变量 CeV 来 说 ， 存 在 一 个 被 终结 符 标记 的 弧 ， 这 些 弧 从 节 
点 (gs,w) 出 来 ， 或 者 68(g,,w) 和 包含 了 具有 形式 C 一 .的 项 。 

引 理 20.4.3 设 M 是 LR(0) 文 法 G 的 确定 型 LR(0) 机 。 假 设 8(q,,u) &,& T 49A >w., A 
么 6(q;,ua) 对 于 所 有 的 终结 符 ae 并 来 说 都 是 未 定义 的 - 

WEBB: 根据 引 理 20.4.1, u 是 A 一 w 的 LR(0) 上 下 文 。 假 设 5(g,,ua) 用 于 定义 某 个 终结 符 a。 那 
么 ua 就 是 某 个 规则 B —y 的 LR(0) 上 下 文 的 前 级 。 这 就 意味 着 存在 如 下 的 推导 : 


S-»pBv—pyv—uazv 


XH ze(VUL)*, JFRHve L’. SRAM EH z 的 可 能 性 ， 如 果 ze X^, JA uaz 是 规则 Boy 的 
LR(0) EFX, WME z 不 是 终结 符 串 ， 那 么 存在 一 个 从 z 推 导出 来 的 终结 符 串 

z-»rCserts ROSCIUS 
这 里 Cot 是 从 z 推 导 终结 符 串 的 过 程 中 最 后 应 用 的 规则 。 将 S 的 推导 和 z 联合 起 来 ， 可 以 看 出 wart 是 
“的 LR(0) 上 下 文 。 无 论 哪 种 情况 ，u 都 是 LR(0) 上下文 ,并且 ua 是 活 前 缀 。 这 与 假设 G 是 LR(0) 
的 相 矛 盾 。 m 

前 面 的 结果 可 以 与 定义 20. 1.2 结合 起 来 ， 以 便于 获得 LR(O) 文法 在 确定 型 LR(0) 机 的 结构 方面 
的 描述 。 

定理 20.4.4 设 G 是 具有 非 递归 开始 符号 的 上 下 文 无 关 文法 。G 是 LR(0) 文 法 的 ， 当 且 仅 当 G 
的 确定 型 LR(0) 机 的 扩展 的 状态 转换 函数 6 满足 下 列 情况 : 

i) wR Ê (q, u) 包含 完全 项 A —€w. ， 并 且 w 关 和 A， 那么 (gq,,u) 不 包含 其 他 项 。 

ii) 如 果 ÊC u) 包含 完全 项 A —., BA Âl u) 中 所 有 其 他 项 的 标记 后 面 都 要 跟 上 一 个 变量 。 

WEBB. 首先 ， 要 证 明 当 扩展 的 状态 转换 函数 满足 情况 (i) 和 C) 的 时 候 ， 具 有 非 递归 开始 符号 
的 文法 G 是 LR(0) 的 。 设 4 是 规则 A 一 w 的 LR(0) 上 下 文 。 那么 8(g,,w) 只 有 在 v 以 变量 开头 的 时 
候 才 被 定义 。 这 样 ， 对 于 所 有 的 串 ve X' ,uve LR(0) -CONTEXT (Bx) 就 意味 着 v= 入 、B =A 关 
Hwzx, 

反 过 来 , 设 G 是 LR(0) 文 法 ， 并 且 是 规则 4 一 mw 的 LR(0) 上下文。 根据 定理 20.4.1 8(4,,u) 
包含 了 完全 项 A —w. 。 状 态 8 (4, u) 不 包含 任何 其 他 完全 项 Bv. AW ROR udi Bv 的 
LR(0) 上下文。 根据 引 理 20. 4. 3， 所 有 从 8(9,,z) 出 来 的 弧 必 须 使 用 变量 来 标记 。 

现在 ,假设 5(g,,u) 包 含 完 全 项 A 一 mw. ， 其 中 w 关 入。 根据 引 理 20.4. 2， 如 果 存 在 一 个 弧 ， 它 被 
以 6(g,,u) 结 尾 的 变量 标记 ,那么 56(g,,u) 包 含 了 完全 项 Co. 或 者 8(g,,u) 具 有 一 个 从 它 出 来 ， 并 且 
被 终结 符 标 记 的 弧 。 在 以 前 的 情况 中 , u 即 是 4 —w 的 LR(0) 上下文， 也 是 Con 的 LR(0) 上 下 文 ， 
这 与 假设 G 是 LR(0) 的 相 了 矛盾 。 后 面 一 种 情况 与 引 理 20. 4. 3 相 矛盾 。 这 样 ，4 ow. Æ ôC, u) HH 
惟一 项 。 m 

直观 上 来 看 ， 可 以 这 样 说 ， 如 果 一 个 包含 一 个 完全 项 的 状态 不 包含 其 他 项 ， 那 么 该 文法 是 LR(0) 
的 。 对 于 由 非 空 规则 生成 的 完全 项 来 说 ， 这 种 情况 被 所 有 包含 该 完全 项 的 状态 满足 。 对 于 包含 4- 的 
状态 来 说 ， 前 面 的 定理 允许 该 状态 包含 标记 后 跟随 变量 的 项 。 考 虑 使 用 规则 S—aABc, A> 和 .Bb 的 
推导 ， 显 示 如 下 : 

S ABC -aAbc -2abc 


HB a dé A>) BI LR(O) EFX, IFAS aAb HRT, Mi aAD Æ Bod HY LR(O) 上下文。 例 20.4.1 可 以 
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609| 演示 使 用 LR(0) 分 析 器 中 的 入 -规则 进行 归 约 的 效果 。 





例 20.4.1 给 出 如 下 文法 : 


G: S—BAAb 
4 一 人 入 
B—b 


其 确定 型 的 LR(0) 机 显示 如 下 : 





利用 该 机 的 计算 来 跟踪 串 bb 的 分 析 ， 该 分 析 可 以 用 于 详细 说 明 分 析 器 的 动作 。 





u y 计算 行为 

入 bb Ê (asà) = | S—. BAAb 移动 
B—. b} 

b b 8(q,,b) = | Bb. | 归 约 

B b 8(q,,B) = | SB. AAb 归 约 
A—. | 

BA b §(q,,BA) = | S BA. Ab 归 约 
A. | 

BAA b 8 (q,,BAA) = | S2BAA. b} 移动 

BAAb ^ §(q,,BAAb) = | S-BAAL. | 归 约 


每 当 LR(0) 机 停机 于 一 个 包含 完全 项 4 一 的 状态 的 时 候 ， 分 析 器 均 使 用 规则 A 一 . 归 约 名 型。 此 
归 约 将 A 加 入 到 当前 扫描 串 的 尾部 。 在 下 一 个 迭代 中 ,LR(0) 机 跟踪 用 4 标记 的 弧 ， 从 而 到 达 后 来 的 
RE. RAMA 的 出 现 增加 了 可 以 识别 的 项 的 前 缀 的 时 候 ，4 才 由 归 约 生成 。 m 
定理 20. 4. 4 确立 了 一 个 用 于 确定 文法 是 否 是 LR (O) 的 程序 。 这 个 程序 从 构造 文法 的 确定 型 











610| LR(0) 机 开始 。 如 果 定 理 20.4.4 中 的 情况 (i) 和 (ii) 带 来 的 限制 被 LR(0) 机 满足 ， 那 么 具有 非 递 





归 开 始 符号 的 文法 是 LR(0) 的 。 
例 20.4.2 利用 标记 # 展 的 文法 AE 


AE: S—A# 
A>A+T|T 
T—b| (A), 
是 LR(0) 的 。AE 的 确定 型 LR(0) 机 在 图 20-3 中 给 出 。 因 为 每 个 包含 完全 项 的 状态 是 一 个 独 集合 ,， 文 
法 是 LR(0) 的 。 oO 
例 20.4.3 文法 
S—A# 
AA-*T|T 


T—T-F|F 
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F—b| (A) 


不 是 LR(0) 的 。 文 法 是 通过 增加 变量 F (AR) 到 AE 而 产生 一 些 乘 法 子 表达 式 。 这 个 文法 不 是 


LR(0) 的 ， 这 可 以 通过 构造 确定 型 LR(0) 机 的 两 个 状态 加 以 证 明 。 





F— .(4) 


由 处 理 了 生成 的 计算 包含 完全 项 AA T. 和 项 7 一 站 。 当 分 析 器 扫描 串 了 工 的 时 候 ， 存 在 两 种 可 


能 的 动作 过 程 : 使 用 AOT 归 约 或 者 进行 转换 以 尝试 构造 串 了 ，F。 





图 20-3 AE 带 边界 标记 的 确定 型 LR(0) 机 


L1 
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20, 5. LR(1) 3% 


LR(0) 的 情况 对 于 构造 用 来 定义 程序 编程 语言 的 文法 来 说 ， 限 制 太 多 。 在 本 节 中 ， 我们 对 LR 分 析 
器 做 了 修改 ， 从 而 可 以 利用 预 读 子 串 所 获得 的 信息 ， 这 个 子 串 可 以 匹配 规则 的 右 部 。 预 读 受 限于 单 符 
号 。 具 有 明显 更 改 的 定义 和 算法 可 以 扩展 从 而 利用 任何 长 度 的 预 读 集合 。 

对 于 一 个 文法 ， 如 果 该 文法 中 的 串 可 以 使 用 一 个 符号 长 度 的 预 读 来 进行 确定 型 分 析 ， 那 么 这 个 文 
法 就 被 称 为 LR(1) 的 。 预 读 符号 是 紧 靠 将 要 被 分 析 器 归 约 的 子 串 的 右边 的 符号 。 当 扫描 一 个 具有 形式 
uwz 的 串 的 时 候 ， 就 要 使 用 规则 Aw 进行 归 约 ， 其 中 ，ze XUlA]. 在 理解 了 LR(0) 文 法 的 例子 之 
后 ， 如 果 存 在 如 下 这 样 一 个 推导 

S uAv Qu, 

那么 串 uwz 被 称 为 LR(1) 上下文 (LR(1)context) , Kfz Æ v 825—415, üWlRv-A, 那么 z 就 是 
空 串 。 因 为 自 底 向 上 分 析 器 构造 的 推导 是 最 右 推导 ， 所 以 预 读 符号 z 要 么 是 一 个 终结 符 符 号 ,要么 是 
空 串 。 

预 读 符 号 的 作用 就 是 用 于 减少 分 析 器 必须 要 检查 的 可 能 性 的 数目 ， 这 是 通过 在 下 述 文法 中 考虑 归 
约 来 证 明 的 : 


G: S—A| Bc 
A—aA | a 
B—.a | ab. 
当 LR(0) 分 析 器 读 取 符 号 a， 此 时 ， 存 在 三 种 可 能 情况 : 
i) EH Aa 进行 归 约 
i) 使 用 Boa 进行 归 约 


iii) 移 进 以 获得 aA 或 者 ab 
一 个 符号 的 预 读 对 于 确定 合适 的 操作 来 说 是 足够 的 。 当 初始 a 被 分 析 器 扫描 到 时 ， 那 么 在 下 面 每 一 个 
推导 中 ， 加 下 划 线 的 符号 就 是 预 读 符号 。 


SA S —A S —Bc S Bc 
sa =aA =ac =abc 

—aaA 

-—aaa 
在 前 面 的 语法 中 ， 当 读 取 到 一 个 a 的 时 候 ，“ 扫描 的 字符 虽 anes H5 
分 析 器 的 动作 完全 是 由 预 读 符号 来 决定 的 。  ” a nv aA 

LR(0) 分 析 器 的 动作 是 由 文法 的 LR(0) a a 移动 

机 的 计算 结果 决定 的 。LR(1) 分 析 器 将 预 读 a b 移动 
符号 合成 到 确定 程序 中 。LR(1) 项 是 一 个 有 z 3 用 B—a 归 约 


序 对 ， 它 包含 了 LR(0) 项 和 一 个 包含 可 能 的 预 读 符 号 的 集合 。 

定义 20.5.1 ik G-(V,XE,P,S)R ETXJAXXk, G 的 LR(1) 项 (LR(1) Item) 具有 如 下 
形式 

[4 一 v, lz, 2, 77, zl, 

HP, AcuveP, ER ZeXEU {A}. KF 14,4, =, %| 是 LR(1) 集 合 的 预 读 集 合 。 

项 [A—wv, l1z.25.-'.:,1] 的 预 读 集合 包括 最 右 推 导 中 跟随 wv 的 终结 符 串 y 的 第 一 
个 符号 。 

S —»xAy —xuvy 

因为 3 规则 是 非 递归 的 ， 所 以 惟一 被 规则 Sw 终止 的 推导 是 % 一 w。 该 推导 中 空 串 跟随 在 w 之 后 。 这 
样 ， 规 则 S 的 预 读 集合 一 直 都 是 独 集 合 [Alo 

像 以 前 一 样 ， 在 项 里 面 的 完全 项 中 ,标记 跟随 在 规则 的 整个 右 部 。LR(1) 机 指明 了 LR(1) 分 析 器 
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的 动作 ， 它 是 由 文法 的 LR(1) 项 构造 的 。 

定义 20.5.2 设 G=(V,,P,S) 是 上 下 文 无 关 文 法 。G 的 非 确 定型 LR(1) 机 是 NFA - AM = (Q, 
VUZ，6,，9qo，Q),， 这 里 QQ 是 利用 状态 go 增长 的 LR(1) 项 的 集合 。 状 态 转换 函数 定义 如 下 

i) 6(q,r) =[{S—.w, {dr} ] | SoweP} 

ii) 6([A—u. Bv,| z,,-*-,z,}],B) ={ [AuB.v,{ z,,---,z,}]} 

iii) 6([A—u. av, {-z,,°*+,Z,} ],@) =| [Auau 2,772,111! 

iv) 6([A—u. Bv, | z,,2,1],3) =| [Bow | yom t ] | BoweP, 这里， 对 于 某 些 了 来 说 
y, e FIRST, (vz,) | 

如 果 忽视 预 读 集合 ,那么 (i), Ci) 和 (i) 中 定义 的 LR(1) 机 的 状态 转换 具有 和 LR(CO) 机 相 
同 的 形式 。LR(1) 项 [4 一 & v, | z3, 2, 75, % |] 表明 了 分 析 器 已 经 扫描 过 串 u, 并且 正 在 尝试 要 
找到 v 从 而 完成 规则 的 右 部 匹配 。 情 况 〈ii) 和 (ui) 生成 的 状态 转换 表现 了 匹配 规则 的 右 部 所 进行 
的 中 间 步 又 ， 并 且 没有 更 改 预 读 集合 。 情 况 (iv) 引入 了 如 下 形式 的 状态 转换 : 


入 
[B —-.w Oh ,WY 


紧 跟 在 这 个 弧 之 后 ，LR(1) 机 跟随 此 弧 ， 并 且 尝 试 匹 配 规则 Bow 的 右 部 。 如 果 串 w 找到 了 ， 那 么 归 


约 uwv 则 按 要 求生 成 了 uB. v。 预 读 集合 包含 了 跟随 w 的 符号 ， 也 就 是 说 ， 如 果 uv ， 那 么 串 中 第 一 
个 终结 符 是 由 v 和 预 读 集合 la, +, Zz.) 推导 出 来 的 。 

F Aw 是 文法 的 规则 ， 自 底 向 上 分 析 器 就 可 能 将 串 uw 归 约 到 w4。 当 发 生 这 种 情况 的 时 候 ， 
LR(1) 分 析 器 使 用 预 读 集合 来 决定 是 否 要 归 约 还 是 要 转换 。 如 果 58(q,,zw) 包 含 了 完全 项 
[A—w. ,| z ,2 2,1), WRAY BM 4 MRA SERS | z, ,…,z| Po 

文法 G 的 非 确定 型 和 确定 型 LR(1) 机 的 状态 转换 图 如 图 20-4 和 图 20-5 所 示 。 





[4 —3»1.B» (2, .... 293 





图 20-4 G 的 非 确 定型 LR(1) 机 
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[S— 4., 03] 





[S— Bc., {A}] 






[4 — a.4, 03] 
[4 — a., {A}] 
[4 — .a4, 0] 
[4 > .a, 3] 
[B — a., {c}] 
[B — a.b, {c}] 






[B — ab.,{c}] 










[A 4.4, 0] 
[A — .a4, (3] 
[4 —..a, {A}] 
[4 >a., 03] 






图 20-5 G 的 确定 型 LR(1) 机 


文法 G 的 形式 如 下 所 示 : 
G: S—A|Bc 
A=*aAl|a 
Ba | ab 
如 果 分 析 器 的 动作 是 由 使 用 单一 预 读 符号 来 惟一 确定 的 ， 那么 文法 是 LR(1) 的 。 确 定型 LR(1) 机 的 结 
构 可 以 用 于 定义 LR(1) 文 法 。 


定义 20.5.3 设 G 是 具有 非 递归 开始 符号 的 上 下 文 无 关 文 法 。 如 果 G 的 确定 型 LR(1) 机 的 扩展 
状态 转换 函数 满足 下 述 情况 ， 那 么 文法 G 是 LR(1) 的 : 

i) wR 6(q;,u) 包含 了 完全 项 [A 一 w. ,| 2,252] ] 8. AC u) &4 1 9R[B—r. as, | y,,y2, 
yi] ,那么 ,对 于 所 有 的 1<i<n,azz。 

ii) oR 8(q, u) 包含 了 两 个 完全 项 [A 一 w. ,| Ziz} LBV. ,| ye] ,那么 ,对 于 
PAH 1 <i<k fo 1 <j<n,y, FZ; - 

例 20.5.1 确定 型 的 LR(1) 机 是 为 文法 AE 构造 的 。 包 含 完 全 项 SA 的 状态 也 包含 了 AA. + 
T。 这 样 看 来 ，AE 就 不 是 LR(0) 的 。 一 旦 进入 这 个 状态 ，LR(1) 分 析 器 就 会 因 失败 而 停机 ， 知 道 预 读 
符号 是 + 或 者 空 串 。 在 后 面 这 种 情况 中 ， 整 个 输入 上 串 都 已 经 被 读 和 信 ， 并 且 指 明了 使 用 规则 SA 的 归 
约 。 当 预 读 符 号 是 + 的 时 候 ， 分 析 器 发 生 转 换 ， 以 尝试 构造 串 4 +T 口 
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do 
[S — .4, 04] 

[4 —>.T 0,*3] 

[4  4* T, 0,0] 
[T .5(044] 
[7.0.0.0] 


[T 5, 0,4] [470.3] 


[S —A., {A}] 
[4 4.47, 0,43] 














[T (A), 3] 
[4 AFT 05:3] 
[A —.7, 048] 
[T 一 .t+ 
[T 一 .0 ,人 + 







[4 A71, {A,+}] 
[T — .(4), 0.5] 
[71 <b; Q8] 





[T (4), 0, +3] 
[4 — A.*T, {A,+}] 





[AS 4 * T, 045] [T (4). 0.11] 


LR(1) 文 法 分 析 器 的 扫描 种 u 的 动作 是 由 计算 ô (a, u) 的 结果 来 决定 的 。 算 法 20.5.4 给 出 了 用 于 
分 析 LR(1) 文 法 的 确定 型 算法 。 


算法 20. 5.4 
用 于 LR(1) 文 法 的 分 析 器 
输入 : LR(1) 文 法 GE (V, E,P,S) 

PAB pel” 

G 的 确定 型 LR (1) 机 器 
l. Let pez Heze 3 U iA} EL ed” 

(z 是 向 前 的 符号 , v 是 输入 的 提示 符 ) 
2. wi =Ñ 
3. dead-end : =false 
4.repeat , 
4. 1. if à (4, u) EE | A—w. 12 ,...,2,1] 
其 中 u =xw 且 对 于 某 个 1 <i<n A z =z then u; -xA 
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else if <4) 且 8(g,,u) 包 含 一 个 项 A—p. zq then 

(转移 并 获得 新 的 向 前 的 符号 ) 
4.1.1.4: -uz 
4.1.2. i vzz', R'i"ze YU {A} Av ed’ 
4.153. Vi Sy 

end if 

else dead-end: = true 

until uw — S or dead — end 
5.ifu- S then 接收 else 拒绝 


对 于 LR(1) 文 法 来 说 ，LR(1) 机 的 结构 保证 了 步骤 4. 1 指定 的 动作 是 惟一 的 。 当 一 个 状态 包含 了 
多 于 一 个 完全 项 的 时 候 ， 预 读 符号 就 会 指明 合适 的 操作 。 
例 20.5.2 算法 20.5.4 和 图 20 -5 中 的 确定 型 LR(1) 机 使 用 下 述 文法 分 析 串 aaa 和 ac: 








G: S—A|Bc 
A> aA | a 
Ba |ab. 
z y 计算 行为 
a aa 3(q,,d) = {[S—.4,{al], 转移 
[S—. Bc, {ar} ], 
[A—.aA,14A1], 
[A— a, [X1], 
[ B. ajc} ], 
[B—. ab|c| ]] 
a a a 8(q,,a) = I[A—a. A, {A} ], 转移 
[Aa. SIATT, 
[A—. aA,1A1 ], 
[A—. a,|1X1], 
[B—a. ,1cl], 
[Ba. b, 1c] ]] 
aa a 入 8(4,,aa) = 1[A—2.A,|AT], 转移 
[A—. aA, ], 
[4—.a, {XH], 
[4 一 a. , | ]] 
aaa Ñ 入 8(4,,aaa) = |[A—2. 4,141], 归 约 
[4 一 . a4 ,人 入 | ] ， 
[4 一 : a, {ar} ], 
[4 一 a. |n} ]I 
aaA X 入 8(4,,aaA) = I [A—2A. {dX} ]} 归 约 
aA 入 入 8(4,,aA) = I [A—2a4. , {A} ]} 归 约 


A 入 入 8(4,,A) = I [S—4. {a} ] } 归 约 








(E) 
u z v 计算 行为 
S 
入 a € 8(4,,3) = {[S—.A, {a} ], 转移 
[$—. Bc, 1X1], 
[A aA, [A] ]， 
[A—.a,1A] ], 
[B—. alc} ], 
[B—. abl c] ]] 
a c 入 8(4,,a) = | [A—2a. 4,141], 归 约 
[A—a. ,| 入 | ]， 
[A—. aA, [Al ], 
[A—. a,1X1 ], 
[ Boa. ,{c}], 
[ Ba. b,\ct]} 
B c 入 8(4,,B) = {[S—+B.c,{d} ]] 转移 
Bc 入 入 ô (a, Bc) = {[S-+Be. 3011] 归 约 
S O 
20.6 练习 


l. 
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给 出 下 属 文法 规则 的 LR(O) 上 下 文 。 建 立 非 确 定型 LR(0) 机。 利用 这 个 构造 确定 型 LR(0) 机 。 文 法 是 
LR(0) 的 吗 ? 


a) S—AB b) S—Ac 
A—4aA | b ABA | X 
B—bB|a B—aB | b 

c) SOA d) S—aA| AB 

` AaAb | bAa | d A—aAb | b 

B—ab | b 

e) S—BA| bAB f) SA | aB 
A4aA | X A—BC|X 
B—Bb | b B—Bb | C 

C>Cce| c 
. 建立 下 述 文法 的 确定 型 LR(0) 机 。 
S—aAb | aB 
A—Aa | X 
B—4Ac. 


利用 例 20. 3. 1 中 描述 的 技术 来 跟踪 串 aaab 和 串 ac 的 分 析 。 


. 证 明 没有 末端 标记 的 文法 AE 不 是 LR(0) 的 。 

. 证 明 引 理 20. 4. 2, 

. 证 明 LR(0) 文 法 是 无 二 义 性 的 。 

. 定义 规则 Aw B] LR(k) 上 下 文 。 

. 对 于 下 述 每 一 个 文法 ， 构 造 其 非 确定 型 和 确定 型 LR(1) 机 。 该 文法 是 LR(1) 的 吗 ? 


a) S>Ac b) SOA 
ABA | X A—AaAb | X 
B—aB | b 
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c) SA d) SoA 
A—aAb | B A—BB 
B—Bb|b B—aB|b 

e) SoA 


A—4AAa | AAb | c 
8. 为 例 20. 4. 3 中 引入 的 文法 构造 LR(1) 机 。 该 文法 是 LR(1) 的 吗 ? 


9. 利用 LR(1) 分 析 器 和 文法 AE 分 析 下 述 串 。 使 用 例 20. 5. 2 中 给 出 的 格式 跟踪 分 析 器 的 动作 。AE 的 确定 


型 LRC1) 机 在 例 20. 5. 1 中 给 出 。 
a) b+b 

b) (5) 

c) b+ «b 


参考 文献 注释 


LR 文法 在 Knuth [1965] 中 引入 。LR 机 中 的 状态 移 进 和 状态 转换 数 对 于 计算 机 语言 分 析 来 说 是 
不 实际 的 。Korenjak [1969] 和 De Remer [1969, 1971] 开发 出 了 简化 方法 ， 从 而 消除 了 这 些 困难 。 
后 边 的 工作 引入 了 SLR (简单 LR) 和 LALR ( 预 读 LR) 文法 。LR(k) 文 法 类 和 可 以 被 确定 型 分 析 的 
其 他 类 文法 (包括 LR(K) 文 法 ) 之 间 的 关系 在 Aho 和 Ullman [1972, 1973] 中 得 到 阐述 。 


WRI 标记 索引 








符号 页 码 9 解释 
€ 8 f. 的 元 素 
¢ 8 不 是 …… 的 元 素 
Ix] 8 x 的 集合 
N 8 自然 数 集合 
Ø 8 EE 
c 8 是 … 的 子 集 
P(X) 9 Fe ER 
U 9 3t 
n 9 AE 
r 9 X-Y: zx 
X 9 补 
x 11 XxY: 笛 卡 儿 积 
[x,y] 11 有 序 对 
p xy 12 是 从 和 到 了 的 函数 
f(x) 12 x 的 由 函数 了 赋予 的 值 
f(x) 1 13 f(x) REM 
foo 13 fx) BEM 
div 13 整数 除法 
= 15 等 价 关 系 
ES 15 等 价 类 
card 16 集 的 势 
E 24, 300 后 继 函 数 
> 31, 398 有 界 总 和 
A 39, 395 真 减 
入 42 空 串 
p 42 二 上 的 串 集合 
length 43 串 的 长 度 
uy 44 u Al v 的 连接 
u" 44 于 个 & 连接 
u® 45 u Bx 
XY 47 集合 X 和 集合 了 连接 
47 Tri X ER EK 
x 48 X EWE 
Xt 48 和 上 的 非 空 串 
eo 48 无 穷 
[7] 50 空 集 的 正则 表达 式 
入 50 空 串 的 正则 表达 式 
a 50 集合 jal 的 正则 表达 式 








”本 页 码 所 指 的 是 本 书页 边栏 中 标注 的 页 码 。 一 一 编辑 注 
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符号 页 码 
U 50 

= 65, 69, 326 
=> 67, 69, 326 
5 69, 326 

b 69 

ux 69 

L(G) 70, 326 
n,(u) 84 

? 91 

> 91 

Ao 94, 631 

à 147, 163, 222, 256 
L(M) 148, 163, 234, 260 
F 149, 224, 258 
i 149, 224, 258 
$8 151, 185 

入 - closure 170 

r 222, 256 
B 256 

lo 286 

XL 298 

XL 298 

i 299, 471 

z 300, 390 

e 300 

p, 300, 390 
id 301 

pred 301 

è 308 

c; P 311, 391 
Lx] 320 

P 343 

U 356 

Ly 357, 365 

P 372 

! 393 

I 398 

i=0 

uzLp] 400, 413 
uzLp] 401 

quo 404 

pn(i) 405 

gn, 406 
dec(i,x) 407 

Eny 408 

trm 417, 420 
P 431, 468 


(5) 





正则 表达 式 的 并 操作 
文法 的 规则 
应 用 一 个 规则 进行 推导 
由 … 推 导 的 


使 用 一 个 或 者 多 个 规则 进行 推导 的 


使 用 n 个 规则 进行 推导 
文法 G 的 语言 

在 wu 中 出 现 的 次 数 

最 左 规则 应 用 

最 右 规则 应 用 

A 的 出 现 是 可 选择 的 

状态 转换 函数 

M 机 的 语言 

由 一 个 状态 转换 生成 


由 零 个 或 者 多 个 状态 转换 生成 


扩展 的 状态 转换 函数 
入 - 闭 包 函 数 

栈 或 者 带 字母 表 
空 带 符号 

字典 顺序 

HA L 的 特征 函数 
HE L 的 部 分 特征 函数 
i 的 表示 法 

FRA 

空 函 数 

个 变量 的 投影 函数 
恒 等 函 数 


具有 K 个 符号 的 常 函 数 
小 于 等 于 x 的 最 大 整数 
判定 问题 

通用 图 灵机 

停机 问题 的 语言 

递归 可 枚 举 语言 的 特性 
阶 


有 界 乘积 


无 界限 最 小 值 

有 界 最 小 值 

商 函 数 

计算 第 i 个 素数 的 函数 


k Y 个 变量 的 哥 德 尔 数 函 数 


解码 函数 

A FLAS BE EAR BL PR BL 
图 灵机 跟踪 函数 

多 项 式 语言 的 类 























LA(A—w) 
trunc, 

FIRST, ( u) 
FOLLOW, (A) 
shift 
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解释 
非 确定 的 多 项 式 语 言 的 类 
函数 8 的 大 O 表示 法 
PRIX 8 的 大 9 表示 法 
i 的 绝对 值 
时 间 复 杂 性 函数 
大 于 等 于 x 的 最 小 整数 
问题 实例 p 的 表达 式 


A 


可 满足 性 问题 的 语言 

NP 完全 问题 的 类 

NP 的 补 

空间 复杂 性 函数 

下 确 界 ， 最 大 的 受 限 下 界 值 
多 项 式 空间 语言 的 类 

非 确定 的 多 项 式 空间 语言 的 类 
文法 G 的 图 

变量 4 的 预 读 集合 

规则 Aw 的 预 读 集 合 

长 度 为 的 切断 函数 

88 u 的 FIRST, 集合 

变量 A 的 FOLLOW; 集合 - 
移 进 函数 
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名 称 





区 -| 人 2 


~ 


Se X9 ely Qq 9 4 OW E xx 


alpha 
beta 
gamma 
delta 
epsilon 
zeta 
eta 
theta 
iota 
kappa 
lambda 
mu 

nu 

xi 
omicron 
pi 

rho 
sigma 
tau 
upsilon 
phi 

chi 

psi 
omega 





附录 亚 ASCcI Sie 


美国 标准 代码 是 用 于 信息 转换 的 ， 该 标准 码 的 一 种 更 为 普遍 的 引用 方式 是 ASCI 码 。 这 种 代码 可 
以 表示 可 印刷 符号 以 及 使 用 数字 0 到 127 的 二 进 制 表示 法 的 特殊 功能 。 数 字 0 到 31 是 控制 字符 ， 并且 
该 栏 标记 的 名 字 给 出 了 与 字符 相关 的 动作 的 缩写 。 例 如 ， 数 字 14 和 15 表示 如 果 遇 到 这 样 的 字符 ， 印 
刷 字符 应 该 从 新 一 行 开 始 (LEF， 换 行 ) 或 者 从 新 一 页 开始 (FF， 换 页 ) 。 数 字 32 (空白 区 ) 到 126 已 
经 作为 文本 文档 的 标准 编码 而 得 到 广泛 接收 。 













=i 

t 

ON 
i 


等 号 
@ 

A 97 a 

B 98 b 

C 99 c 

D 98 d 

E 101 e 

F 102 f 

G 103 g 

H 104 h 

I 105 i 

J 106 j 

K 107 k 

jm 108 1 
M 109 m 

; N 110 n 

15 O SI / O 111 o 
16 ad DLE 0 P 112 p 
17 Q DC1 1 Q 113 q 
18 R DC2 2 R 114 r 
19 ^S DC3 3 S 115 s 
20 T DC4 4 T 116 t 
21 U NAK 5 U 117 u 
22 aN SYN 6 V 118 V 
23 wW ETB 7 w 119 w 
24 ^X CAN 8 X 120 x 
25 ^Y EM 9 Y 121 y 
* : Z 122 z 

[ 123 { 

\ 124 | 

] 125 } 


WRI Java 的 BNF 范式 定义 


Java 程序 设计 语言 是 在 Sun Microsystems 公司 的 James Gosling 的 指导 下 开发 出 来 的 。Java 于 1995 
年 问世 ， 该 语言 平台 独立 ， 是 一 种 面向 对 象 的 编程 语言 ， 对 于 Internet 和 网 络 应 用 程序 尤为 适用 。 自 
i, Java 变 成 了 Internet 应 用 程序 最 为 通用 的 语言 之 一 。 
Java 语言 的 语法 是 从 Gosling 等 人 定义 的 BNF 范式 推导 出 来 的 [2000] 。 除 了 在 符号 上 标 有 opt 作 
为 下 标 ， 以 保留 终结 符 或 者 变量 的 名 称 作为 选项 之 外 ， 规 则 已 经 被 转换 成 标准 的 上 下 文 无 关 符号 。oPt 
的 使 用 减少 了 所 需 规则 的 数目 ， 但 是 带 有 可 选 构件 的 规则 可 以 很 容易 地 被 转换 成 等 价 的 上 下 文 无 关 文 
法 。 右 边 带 有 变量 .B。, 的 规则 可 以 被 两 个 规则 代替 。 其 中 一 个 是 将 Buw 用 了 来 代替 ， 然 后 它 在 另 一 个 
规则 中 被 删除 。 例 如 ,A 一 B,C 用 A-3BC| C 来 代替 。7 个 带 有 下 标 opt 的 符号 可 以 创建 2 个 上 下 文 
无 关 的 规则 。 文 法 的 开始 符号 是 变量 《编译 单元 。 
1. (CompilationUnit) — (PackageDeclaration) ,,, < PRIME NS SN "s 
( TypeDeclarations) ,,, 
Declarations 
2. (ImportDeclarations) — (ImportDeclarations) | (ImportDeclarations) 
(ImportDeclaration ) 
3. (TypeDeclarations) — (TypeDeclaration) | 
( TypeDeclarations) ( pl 
. (PackageDeclaration) —package (PackageName); 
. (ImportDeclaration) —+ ( SingleTypelmportDeclaration ) | (TypelmportOnDemand) 


4 
5 
6. (SingleTypelmportDeclaration) 一 import (TypeName) ; 
7. (TypelmportOnDemandDeclaration) —import (PackageName) . * 
8. (TypeDeclaration) —> ( ClassDeclaration) | ( Declaration) ls 
9. (Type) — (PrimitiveType) (ReferenceType) 
10. (PrimitiveType) — (NumericType) . boolean 
11. (NumericType) —> (IntegralType) | (FloatingPointType) 
12. (IntegralType) —byte |short |int |long |char 
13. ( FloatingPointType) —float |double 
Reference Types and Values 
14. (ReferenceType) — (ClassOrinterfaceType) | (ArrayType) 
15. (ClassOrInterfaceType) — (ClassType) | (InterfaceType) 
16. (ClassType) — (TypeName) 
17. (InterfaceType) — (TypeName) 
18. (ArrayType) — (Type) [] 
Class Declarations 
19. (ClassDeclaration) — (ClassModifier) „class (Identifier) (Super) o (Interfaces) ,, 
( Classbody) 
20. ( ClassModifiers) — (ClassModifier) | ( ClassModifiers) ( ClassModifier) 
21. (ClassModifier) —public | abstract | final 
22. (Super) —extends (ClassType) 
23. (Interfaces) —implements ( InterfaceTypeList ) 


FRRIV Java $$ BNF 形式 定义 373 





. (ClassBody) — | (ClassBodyDeclarations) 
. (ClassBodyDeclarations) — (ClassBodyDeclaration) | 


. (ConstructorDeclaration) —  ConstructorModifiers) 





(InterfaceTypeList) — (InterfaceType) | (InterfaceTypeList) (InterfaceType) 


opt } 


( ClassBodyDeclaration). ( ClassBodyDeclarations) 


. (ClassBodyDeclaration) — (ClassMemberDeclaration) | ( StaticInitializer) | 


( ConstructorDeclarations) 


. (ClassMemberDeclaration) — (FieldDeclaration) | ( MethodDeclaration) 


Field Declarations 


. (FieldDeclaration) — (FieldModifiers) ,,, (Type) (VariableDeclarators) ; 
. (VariableDeclarators) — (VariableDeclarator) | (VariableDeclarators) , 


( VariableDeclarator ) 


. (VariableDeclarator) — (VariableDeclaratorID) | 


(VariableDeclaratorsID) = < VariableInitializer) 


. (VariableDeclaratorID) — (Identifier) | ( VariableDeclaratorsID) [ ) 

. (Variablelnitializer) — (Expression) | (Arraylnitializer) 

. (FieldModifiers) — (FieldModifier) | ( FieldModifiers) (FieldModifier) 

. (FieldModifier) —public | protected | private | final ] |static | transient | volatile 


Method Declarations 


. (MethodDeclaration) — (MethodHeader (MethodBody) 
. (MethodHeader) — ( MethodModifiers) 


( ResultType). ( MethodDeclarator) 


opt 


(Throws) 


opt 


. (ResultType) — (Type) | void 
. (MethodDeclarator) — (Identifier) ( (FormalParameterList) ,,, ) 


(MethodDeclarator) |) 


. (FormalParameterList) 一 ( FormalParameter) | 


( FormalParameterList) ( FormalParameter) 


. (FormalParameter) — (Type) (VariableDeclaratorld) 
. (MethodModifiers) — (MethodModifier) | ( MethodModifiers) ( MethodModifiers) 
. (MethodModifier) 一 public | protected | private | abstract | final | 


static | synchronized | native 
(Throws) throws ( ClassTypeList) 


. (ClassTypeList) — (ClassType) | ( ClassTypeList) , ( ClassType) 
. (MethodBody) — (Block) | ; 


Constructor Declarations 


( ConstructorDeclarator ) 


opt 


(Throws) „, (ConstructorBody) 


opt 


. (ConstructorDeclarator) — (SimpleTypeName) ( (FormalParameter List) ,,, ) 
. (ConstructorModifiers) — (ConstructorModifier) | 


( ConstructorModifiers) ( ConstructorModifier) 
( ConstructorModifier) 一 public | private | protected 


. (ConstructorBody) — | (ExplicitConstructorInvocation) ,,, ( BlockStatements) ,,, | 
( ExplicitConstructorInvocation) —this ( (ArgumentList) ,,] ; mid 
super ( (ArgumentList) ,,,| ; 


Interface Declarations 
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74. 


75. 


. (InterfaceDeclaration) — (InterfaceModifiers) 


. (InterfaceBody) — | (InterfaceMemberDeclaration) 
. (InterfaceMemberDeclarations) 一 (InterfaceMemberDeclaration) | 


. (Arraylnitializer) — | (Variable Initializers) 


. (Block) — | (BlockStatements) 
. (BlockStatements) — (BlockStatement) | ( BlockStatements) ( BlockStatement) 
. (BlockStatement) —+ (LocalVariableDeclarationStatement) | (Statement) 








,, Interface (Identifier) 
( ExtendsInterface) „ (InterfaceBody) 


. (InterfaceModifiers) — (InterfaceModifier) | ( InterfaceModifiers) (InterfaceModifier) 
. (InterfaceModifier) 一 public | abstract 
. (ExtendsInterfaces) —extends (InterfaceType) | 


( ExtendsInterfaces) , (InterfaceType) 


opt | 


(InterfaceMemberDeclarations)  (InterfaceMemberDeclaration) 


. (InterfaceMemberDeclaration) 一 ( ConstantDeclaration) | 


(AbstractMethodDeclaration) 
Constant Declarations 


. (ConstantDeclaration) — (ConstantModifiers) ,, (Type) (VariableDeclarator) 
. (ConstantModifiers) —public | static | final 


Abstract Method Declarations 


. (AbstractMethodDeclaration) — (AbstractMethodModifiers) ,,, ( ResultType) 


(MethodDeclarator) (Throws) 


opt 


. (AbstractMethodModifiers) — (AbstractMethodModifier) | 


(AbstractMethodModifiers) (AbstractMethodModifier) 
(AbstractMethodModifier) —public | abstract 
Array Initializers 


opt,opt | 


. (VariablelInitializers) — (Variablelnitializer) | 


( Variablelnitializers) ( VariablelInitializers ) 
Blocks and Local Variable Declaration 


opt } 


( StaticInitializer) —static (Block) 


. (LocalVariableDeclarationStatement) — (LocalVariableDeclaration) 
. (LocalVariableDeclaration) — (Type) (VariableDeclarators) 


Statements 


. (Statement) —> (StatementWithoutTrailingSubstatement) | ( LabeledStatement) | 


(IfThenStatement) | (IfThenElseStatement) | 
( WhileStatement) | ( ForStatement) 
(StatementNoShortlf) — (StatementWithoutTrailingSubstatement) | 
(LabeledStatementNoShortlf) | 
(IfThenStatementNoShortlf) | 
(IfThenElseStatementNoShortlf) | 
( ForStatementNoShortIf) 
(StatementWithoutTrailingSubstatement) — (Block) 
( EmptyStatement) | ( ExpressionStatement) | 
( SwitchStatement) | ( DoStatement) | 
( BreakStatement) | ( Continue Statement) | 


HRI Java #& BNF 范式 定义 325 





76. 
71. 
78. 
79. 
80. 


81. 
82. 
83. 


84. 
85. 
86. 


87. 
88. 
89. 


90. 
91, 
92. 
93. 
94. 


95. 
96. 
97. 


98. 
99. 


100. 
101. 
102. 
103. 


104. 
105. 





( ReturnStatement) | ( SynchronizedStatement) | 

( ThrowStatement) | ( TryStatement) 
Empty, Labeled, and Expression Statements 
( EmptyStatement) —; 
(LabeledStatement) — (Identifier) ; (Statement) 
( LabeledStatementNoShortlf) — (Identifier) ;. (StatementNoShortlf) 
( ExpressionStatement) — (StatementExpression) ; 
(StatementExpression) — (Assignment) | ( PreincrementExpression) | 

( PredecrementExpression) | ( PostincrementExpression) | 

( PostdecrementExpression) | ( MethodInvocation) | 

( ClassInstanceCreationExpression) 
If Statements 
(JfThenStatement) —if ( (Expression) ) (Statement) 
(JfThenElseStatement) —+if ( (Expression) ) (StatementNoShortlf) else (Statement) 
(IfThenElseStatementNoShortlf) —if ( (Expression) ) (StatementNoShortlf) 

else (StatementNoShortlf) 

Switch Statement 
( SwitchStatement) —switch ( (Expression) ) (SwitchBlock) 
(SwitchBlock) — | ( SwitchBlockStatementGroups) ,,, (SwitchLabel) 
( SwitchBlockStatementGroups) 一 ( SwitchBlockStatementGroup) | 


opt } 


(SwitchBlockStatementGroups) ( SwitchBlockStatementGroups ) 
( SwitchBlockStatementGroup) —» (SwitchLabels) (BlockStatements) 
( SwitchLabels) — (SwitchLabel) | ( SwitchLabels) <SwitchLabel) 
( SwitchLabel) —case (ConstantExpression) : | default: 
While, Do, and For Statements 
(WhileStatement) 一 While ( (Expression) ) (Statement) 
( WhileStatement NoShortlf) 一 While ( (Expression) ) ( StatementNoShortlf) 
(DoStatement) —+do (Statement) while ( (Expression) ) ; 
(ForStatement) —for ( (Forlnit) ,,,; (Expression) on ‘ForUpdate) ,,,) (Statement) 
(ForStatementNoShortlf) 一 for ( (Forlnit) ons (Expression) ,,;. ( ForUpdate) Pes 
(StatementNoShortlf) 
(Forlnit) — ( StatementExpressionList) | (LocalVariableDeclaration ) 
(ForUpdate) — (StatementExpressionList) 
(StatementExpressionList) — (StatementExpression) | 
( StatementExpressionList) , ( StatementExpression) 
Break, Continue, Return, Throw, Synchronized, and Try Statements 
( BreakStatement) —break (Identifier) T 
( ContinueStatement) —«continue ( Identifier) 
(ReturnStatement) —return (Expression) 


ope 3 
op 5 
(ThrowStatement) —throw (Expression) ; 
( SynchronizedStatement) —synchronized ( (Expression) ) ( Block) 
(TryStatement) —1try (Block) (Catches) | 
try (Block) (Catches) „ (Finally) 
(Catches) — (CatchClause) | (Catches)  ( CatchClause) 
(CatchClause) —«catch ( (FormalParamenter) ) (Block) 
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106. 


107. 
108. 


109. 
110. 
111. 


112. 
113. 
'114. 
pl; 
116. 


II 


118. 


119. 


120. 


121. 


122. 


123. 


124. 


125. 
126. 


127. 


128. 


129. 


130. 


131. 
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(Finally) —finally (Block) 
Creation and Access Expressions 
(Primary) — (PrimaryNoNewArray) | (ArrayCreationExpression) 
(PrimaryNoNewArray) — (Literal) | this | 
( (Expression) ) | ( ClassInstanceCreationExpression) | 
(FieldAccess) | ( MethodInvocation) | 
(ArrayAccess) 
( ClassInstanceCreationExpression) —new (ClassType) ( (ArgumentList) ,,,) 
(ArgumentList) — (Expression) | (ArgumentList) , ( Expression) ` 
(ArrayCreationExpression) —new (PrimitiveType) (DimExprs) (Dims),,, | 
new (TypeName) (DimExprs) (Dims) 
(DimExprs) — (DimExpr) | (DimExprs) (DimExpr) 
(DimExpr) — | (Expression) | 
(Dims) — [1] (Dims) [] 
(FieldAccess) — (Primary) . (Identifier) | super. (Identifier) 
(MethodInvocation) — (MethodName) ( (ArgumentList) ,,,) | 
(Primary) . (Identifier) ( (ArgumeniList) ,,,) | 
super. (Identifier) ( (ArgumentList) ,,, ) 


opt 


(ArrayAccess) — (ExpressionName) | (Expression) | | 
(PrimaryNoNewArray) | (Expression) | 

Expressions 

(Expression) 一 (AssignmentExpression ) 

(ConstantExpression) — (Expression) 

Assignment Operators 

(AssignmentExpression) —. ( ConditionalExpression) | (Assignment) 

(Assignment) 一 (LeftHandSide) (AssignmentOperator) (AssignmentExpression) 

(LeftHandSide) — (ExpressionName) | ( FieldAccess) | ( ArrayAccess) 

(AssignmentOperator) == | x =|/=|%=| + 

>>=|>>>=|&=| 


|-=l<<esl 
| Ja 


i] 


Postfix Expressions 
( PostfixExpression) — (Primary) | ( ExpressionName) | 
( PostIncrementExpression) | ( PostDecrementExpression) 
(PostIncrementExpression) — ( PostfixExpression) + + 
( PostDecrementExpression) 一 ( PostfixExpression) — — 
Unary Operators 
( UnaryExpression) — (PrelIncrementExpression) | ( PreDecrementExpression) | 
+ (UnaryExpression) | — (UnaryExpression) | 
( UnaryExpressionNotPlusMinus ) 
(PreIncrementExpression) —> + + (UnaryExpression) 
( PreDecrementExpression) — — — ( UnaryExpression) 
( UnaryExpressionNotPlusMinus) — ( PostfixExpression) | ( UnaryExpression) | 
! (UnaryExpression) | ( CastExpression) 


(CastExpression) 一 ( (PrimitiveType) (Dims),,,) (UnaryExpression) | 


opt 


( (PrimitiveType) ) (UnaryExpressionNotPlusMinus Y 


132. 


133. 


134. 


135. 


136. 


137. 


138. 


139. 


140. 


141. 


142. 


143. 


144. 


145. 
146. 
147. 
148. 
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Operators 
( MultiplicativeExpression) — (UnaryExpression) | 
( MultiplicativeExpression) * (UnaryExpression) | 
( MultiplicativeExpression) / (UnaryExpression) | 
( MultiplicativeExpression) 96. ( UnaryExpression) 
( AdditiveExpression) —> (MultiplicativeExpression) | 
(AdditiveExpression) + (MultiplicativeExpression) | 
( AdditiveExpression) —  (MultiplicativeExpression) 
( ShiftExpression) 一 (AdditiveExpression) | 
(ShiftExpression) << (AdditiveExpression) | 
(ShiftExpression) >> (AdditiveExpression) | 
(ShiftExpression) >>> (AdditiveExpression) 
(RelationalExpression) —» (ShiftExpression) | 
(RelationalExpression) < (ShiftExpression) | 
(RelationalExpression) > (ShiftExpression) | 
(RelationalExpression) < = (ShiftExpression) | 
(RelationalExpression) > = (ShiftExpression) | 
( RelationalExpression) instanceof (ReferenceType) 
( EqualityExpression) —> ( RelationalExpression) | 
(RelationalExpression) = = (RelationalExpression) | 
l RelationalExpression) | =  (RelationalExpression ) 
(AndExpression) — ( EqualityExpression) | (AndExpression) & (EqualiltyExpression) 
CExclusiveOrExpression) — (EqualityExpression) | 
( ExclusiveOrExpression) | ( AndExpression) 
(InclusiveOrExpression) —» (ExclusiveOrExpression ) | 
(InclusiveOrExpression) | (AndExpression) 
( ConditionalAndExpression) 一 (InclusiveOrExpression) | 
id ( ConditionalAndExpression) && 
(InclusiveOrExpression ) 
( ConditionalOrExpression) —. ( ConditionalAndExpression) | 
( ConditionalOrExpression) || 
( ConditionalAndExpression ) 
( ConditionalExpression) —» ( ConditionalOrExpression) | 
( ConditionalOrExpression) ? (Expression) : 
( ConditionalExpression ) 
Literals 
(Literal) — (IntegerLiteral) | |F. loatingPointLiteral ) | (BooleanLiteral) | 
( CharacterLiteral) | (StringLiteral) | (NullLiteral) 
(IntegerLiteral) —(DecimallntegerLiteral) | ( HexIntegerLiteral) | 
( OctalintegerLiteral) 
( DecimalIntegerLiteral) — (DecimalNumeral) (IntegerTypeSuffix) s 
( HexIntegerLiteral) — (HexNumeral)  (IntegerTypeSuffix) „p 
( HexIntegerLiteral) — (HexNumeral)  (IntegerTypeSuffix) ,,, 
( OctalIntegerLiteral) — (OctalNumeral) (IntegerTypeSuffix) „p 
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149. (IntegerTypeSuffix) —1 | L 
150. (DecimalNumeral) —0 | (NonZeroDigit) (Digits) r 
151. (Digits) — (Digit) | (Digits) (Digit) 
152. (Digit) —0 | (NonZeroDigit) 
153. (NonZeroDigit) —1| 213141516171819 
154. (HexNumeral) —0x (HexDigit) | OX ( HexDigit) | (HexNumeral) ( HexDigit) 
155. (HexDigit) 20|1|2|3|41|51|6|7|8|9| al bl cl dlel A| BI C| DI E 
156. (OctalNumeral) —0 (OctalDigit) | 0 (OctalNumeral) ( OctalDigit) 
157. (OctalDigit) 50|1121314151617 
158. (FloatingPointLiteral) — (Digits) . (Digits) o 《ExponentPart) 
(FloatTypeSuffix) „| 
. (Digits) ( ExponentPart) ,,, (FloatTypeSuffix) 到 | 
(Digits) (ExponentPart) ( FloatTypeSuffix) „| 
(Digits) (ExponentPart) op XFloatTypeSuffix) 
159. (ExponentPart) — (ExponentIndicator) ( SignedInteger) 
160. (ExponentIndicator) —e| E 
161. (Signedinteger) — (Sign) ,,, (Digits) 
162. (Sign) =+ | - 
163. (FloatTypeSuffix) —t |F |a |D 
164. (BooleanLiteral) —true | false 
165. (CharacterLiteral) —' (InputCharacter)' | ' (EscapeCharacter) ' 
166. (StringLiteral) —" (StringCharacters) 
167. (NullLiteral) —null 
Identifier 
168. (Identifier) — (IdentifierChars) 
169. (IdentifierChars) — (JavaLetter) | (IdentifierChars) (JavaLetterOrDigit) 
变量 (SingleCharacter) , (InputCharacter) , (EscapeSequence) VA (JavaLetter) 定义 了 可 以 用 
于 输入 、 文 字 以 及 标识 符 的 16 - 位 Unicode 字符 集 的 子 集 。 
标识 符 是 通过 变量 (dentifier) 来 定义 的 ， 并 且 使 用 Unicode 字母 表 的 字符 ， 这 样 编程 人 员 就 可 
以 使 用 他 们 自己 的 语言 来 书写 源 代 码 。 标 识 符 的 第 一 个 字符 必须 是 字母 、 下 划 线 或 者 是 美元 符号 ， 后 
边 可 以 跟随 任何 个 数 的 Java 字母 或 者 数字 。Java 字母 或 者 数字 包含 了 可 以 使 方法 字符 
639| .isJavaldentifierPart 返回 ture 的 Unicode ^E ff, Java 关键 字 被 保留 起 来 ， 并 且 不 能 被 当 作 标识 符 
来 使 用 。 
输入 字符 是 Unicode 字符 ， 不 包括 代表 换行 或 者 回 车 键 的 符号 。( SingleCharacter ) 是 输入 字符 ， 
但 是 不 是 ”或 者 \ 。 换 码 序列 包含 一 个 \ ， 后 边 跟随 着 ASC I 符号 来 表示 一 个 非 图 形 字 符 。 例 如 ， 
\n 就 是 换行 序列 ， 它 代表 着 换行 。 有 关 Java 编程 语言 的 语法 和 语义 的 详细 情况 可 以 在 Gosling 等 人 编 
写 的 著作 中 找到 [2000]。 


opt 


" 
opt 
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recognition 误 别 (语言), 260 
recursive 递归 (语言 )，260 
recursive definition of (语言 ) 的 递归 定义 , 46-47 
recursively enumerable 递归 可 枚 举 (语言 )，260 
regular 正则 (语言 ); 49, 82, 200 
of Turing machine 图 灵机 CAF), 260 

Language acceptor, Turing machine as 语言 接收 器 ,图 灵机 
HEH, 259 -262 
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Language enumerator, Turing machine as 语言 人 口 调查 ， 
灵机 作为 ，282 -288 
LBA。 见 线性 有 界 自动 机 
Leaf 叶 ，34 
Left factoring 提取 左 因子 ,，576 
Left-linear context-free grammar 左 线性 上 下 文 无 关 文 法 ， 
220 
Left-recursive rule 左 递归 规则 ，129 
Left-regular context-free grammar 左 正 则 上 下 文 无 关 文 法 ， 
219 -220 
Leftmost derivation 最 左 推导 ,，71，89 -91 
ambiguity and 无 二 义 性 (的 最 左 推导 ) 91-93 
Lexical analysis 词法 分 析 ，553 ，567 
Lexicographical ordering 字典 顺序 ，286 
L'Hospital's Rule 洛 必 达 法 则 ;439 - 440 
Linear-bounded automaton (LBA) 线性 有 界 自动 机 ， 
334 -338 
Linear grammar 线性 文法 ，250 
Linear speedup 线性 加 速 ，448 —451 i 
Literal 文字 的 ，482 
LL(k) grammar LL(k) 文 法 ，571，589 -591 
strong 强 (LL(k) XÆ), 579 -580 
Lookahead 预 读 
set (H) 集 ，572，575，589 
string ( 预 读 ) m, 572 
Lower-order terms 低 阶 项 ，436 
LR(0) 
context 上 下 文 ，595 - 596 
grammar 文法 ，598 , 609 
item mi, 602 
machine #L, 602 -603, 606-610 
parser 4} 47 #%, 599-601, 604 
LR(1) 
context FX, 613 
grammar X iX, 612 -618 
item m, 614 
machine fL, 614 —617 
parser 4} Prag , 618 


M 


Machine: configuration 机 器 格局 
of deterministic finite automaton 确定 性 有 限 自动 机 的 
(机 器 格局 ) 149 
of pushdown automaton 下 推 自动 机 的 (机 器 格局 );， 
224 
of Turing machine 图 灵机 的 (机 器 格局 ) ，256 —258 
Macro 宏 ，302 -305 
Macro-computable function 宏 可 计算 函数 ，430 
Mathematical induction 数学 归纳 ，27 -32 





simple 简单 的 (数学 归纳 )，30 
strong 强 ( 数 学 归纳 ) 30 
Microsoft Word 微软 的 文字 处 理 软 件 Word, 58 
Minimal common ancestor 最 近 公 共 祖 先 ，34 -35 
Minimalization 最 低 程度 ，400 
bounded 受 限 的 最 低 程 度 ，401 
unbounded 不 受 限 的 最 低 程度 ，413 
Monotonic rule 单调 规则 ，333 
Moore machine REAR PL, 156 
p-recursive function 4-1/5 PAL, 414 
Turing computability of (1-35 JH PAHS) 图 灵 可 计算 性 ， 
414 -415 
Multitape Turing machine 多 带 图 灵机 ，268 -274 
time complexity of (多 带 图 灵机 ) 的 时 间 复 杂 性 ， 
447 -448 
Multitrack Turing machine 多 道 图 灵机 ，263 -265 
time complexity of ( 多 道 图 灵机 ) 的 时 间 复 杂 性 ，446 
Myhill-Nerode Theorem Myhill-Nerode 定理 ，211 -217 


N 


n-ary relation n 元 关系 ，12 
n-variable function n-2F fit pA, 12 
Natural language 自然 语言 ，1，5 
Natural numbers 自然 数 ，8 
recursive definition of ( 自然 数 ) 的 递归 定义 ，24 
NFA。 见 Nondeterministic finite automaton 非 确定 型 的 有 限 
自动 机 
NFA-)\, 165 -166 
Node 节点 ，32 
Noncontracting derivation 非 收 缩 性 的 推导 ,，333 
Noncontracting grammar 非 收缩 性 的 文法 ，107 
Nondeterminism, removing 非 确 定性 ， 移 除 ，170 -178 
Nondeterministic complexity 非 确定 型 的 复杂 性 ,442 -446 
Nondeterministic finite automaton (NFA) 非 确定 型 有 限 自 
动机 ，159 -163 
acceptance by 被 〈 非 确定 型 有 限 自 动机 ) 接收 ，161 
examples ( 非 确定 型 有 限 自 动机 ) 的 例子 ，164 - 165 
input transition function ( 非 确定 型 有 限 自动 机 ) 的 输入 
状态 转换 函数 ，169 
A-transition ( 非 确 定型 有 限 自 动机 ) 的 入 - 状态 转移 ， 
165 - 166 
language of ( 非 确 定型 有 限 自动 机 ) 的 语言 ，163 
Nondeterministic LR(0) machine 非 确 定型 LER(0) 机 ， 
602 -603 
Nondeterministic LR(1) machine 非 确定 型 LR(1) 机 ,616 
Nondeterministic polynomial time 非 确 定 的 多 项 式 时 间 ， 
469 
Nondeterministic Turing machine 非 确 定型 图 灵机 ;274 一 282 





Nonregular language 非 正则 语言 ，203 -205 
Nonterminal symbol 非 终 结 符号 , 65, 69 
Normal form 范式 ，103 
Chomsky 乔 姆 斯 基 (范式 ) 121-124, 239 -240 
conjunctive 合 取 (范式 ) ，482 
Greibach 格 立 巴赫 (TA), 131-138, 232 -235 
3-conjunctive 3 - 合 取 (范式 ) 498 
NP, 431, 469 
NPC 492 
NP-complete problem NP- 完 全 问题 ，480 
Bin Packing Problem 装 箱 问 题 , 516 
Hamiltonian Circuit Problem 哈密 尔 顿 回路 问题 ， 
473 -477; 503 -509 
Hitting Set Problem 命中 集 问 题 ; 515 —516 
Knapsack Problem 背包 问题 ，518 
Partition: Problem 分 割 问题 ,，513'=515 
Satisfiability Problem' 可 满足 性 问题 ，473，481 =483 
Subset-Sum Problem 子 集 和 问题 , 473, 509 —513 
3-Satisfiability Problem 3 - 可 满足 性 问题 ，498 —500 
Traveling Salesman Problem 旅行 邮递 员 问 题 ; 517 -518 
Vertex Cover Problem 节点 覆盖 问题 ，500 —503, 527 
NP- hard problem NP- 完 全 问题 ,480 
NPI , 530 
NP - Space NP -空间 ，540 
Null 2 
path (43) 路 径 ，33 
tule ( 室 ) 规则 69 
string ( 空 ) 串 ，42 
Nullable variable 可 空 变量 ，107 
Number-theoretic function 数论 函数 ，299 
Numeric computation 数值 计算 ，299 -301 


O 


One-to-one function 1 Xf 1 PRA, 13 -14 

Onto function 满 函数 ，13 — 14 

Operator bounded 操作 符 上 有 界 的 ，398 —404 
Optimization problem 最 优化 问题 ，517 -518 
Order of a function 函数 的 阶 ，436 

Ordered n-tuple JF n 元 组 , 12 - 

Ordered tree 有 序 树 ;| 33 -34 

Out-degree of a node 节点 的 出 度 ; -32 

Output tape $i ih H7, 282 


P, 431, 468 
P- Space 了 -空间 ，540 

completeness (P- 空 间 的 ) 完全 性 ，544 —545 
Palindrome 回 文 ，60，77 —78, 204, 226 
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Parsing 4}4f, 553, 567 - 568 
bottom-up parser 自 底 向 上 分 析 器 ，555,2561=367 
breadth-first bottom-parser 宽度 优先 自 底 向 上 分 析 器 ， 
563 —567 
breadth-first top-down parser 宽度 优先 自 顶 向 下 分 析 器 ; 
557 -561 
CYK algorithm CYK 算法 (分析),， 124 — 128 
deterministic 确定 性 的 (分析), 554, 571 
LL(k) LL(X) ( 4) Br) ,591 
LR(0) LR(0) (分 析 ) ,599 -601, 604 
LR(1) LR(1) (4X9) ,618 
strong LL(k) 强 LL( 有 (分 析 ) ,587 -588 
top-down 自 顶 向 下 《分析 ) 555 
Partial function 部 分 函数 ，13 
Partition 4) 2], 9 - 
Partition Problem 分 割 问题 ，513,- 515 
Path 路 径 ，32 -33 
null 空 〈 路 径 ) 33 
PDA, Ji, Pushdown automaton 下 推 自动 机 
Phrase-structure grammar 短语 - 结构 文法 ，325 - 326 
Pigeonhole principle $55 JR EB, 206 
Polynomial with integral coefficients 带 积 分 系数 的 多 项 式 ， 
438 
Polynomial language 多 项 式 语 言 ，468 
Polynomially bounded function 有 界 多 项 式 函 数 ，440 -441 
Post Correspondence Problem 波斯 特 对 应 问题 377 -382 
Post correspondence system 波斯 特 对 应 系统 ，377 
Power set RÆ, 9, 20 
Prefix 前 级 ，45 
terminal prefix 终结 符 前 缀 ，129 ，557 
viable 活 (Hj), 599 
Primitive recursion 原始 递归 ，390 一 391 
Primitive recursive function 原始 递归 函数 ，389 -391， 
410 -413 
basic 基本 的 〈 原 始 递归 函数 ) 389 - 390 
examples of (原始 递归 函数 ) 的 例子 ，391 -398 
Turing computability of 原始 递归 函数 的 图 灵机 可 计算 性 ， 
393 -394 
Primitive recursive predicate 原始 递归 谓词 ，395 
Problem reduction 问题 归 约 ,348 -352, 365 —367 
and NP-completeness 和 NP- 完全 ,497 —498, 513 -514 
polynomial-time ZRA [8] 《的 问题 归 约 ),，477 
and undecidability 《问题 归 约 ) URBI ETE, 365 —368 
Projection function 投影 函数 ,， 300, 390 
Proof by contradiction 反 证 法 ，19 -23 
Proper subset 真子 集 ，9 
Proper subtraction Hy, 39, 395 
Pseudo-polynomial problem HEMAN, 471 
Pumping lemma 2& 5| Z8 
for context-free languages HFE PCI (2€ 5] 
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38), 239 -242 
for regular languages 用 于 正则 语言 的 ( 泵 引 理 ) ; 
205 -209 
Pushdown automaton( PDA) 下 推 自动 机 , 2-3, 221-222 
acceptance 接收 ，224 
acceptance by empty stack 被 空 栈 方式 接收 , 230 
acceptance by final state 被 终结 状态 接收 ，229 
atomic 原子 的 (下 推 自动 机 ) ,227 
context-free language and 上 下 文 无 关 语言 和 (下 推 自动 
Jl), 232 -239 
deterministic 确定 型 的 (下 推 自动 机 ), 225 
extended 扩展 的 (下 推 自动 机 )，228 
language of (下 推 自动 机 ) 的 语言 ，230 
stack alphabet (下 推 自 动机 的 ) 栈 字 母 表 ，222 
state diagram (下 推 自动 机 的 ) 状态 图 ，222 -223 
variations (下 推 自 动机 的 ) 变量 ，227 -232 


R 


Random access machine 随即 访问 机 ，323 
Range 值 域 ，12 
Rates of growth 增长 率 ，436 —441 
Reachable variable 可 达 变 量 ，119 
Recognition of language 语言 识别 ，260 
Recursion 递归 
course-of-values 求 值 过 程 ，409 
primitive 原 语 ，390 -391，413 -414 
removal of direct left recursion 直接 左 递归 的 消除 ， 
129 - 131 
simultaneous 同步 (递归) 427 
Recursive definition 递归 定义 , 23 -27, 45 -46 
Recursive language 递归 语言 ，260，346 
Recursive variable 递归 变量 ，71，390 
Recursively enumerable language 递归 可 枚 举 语言 ，260 
Reduction 归 约 ，555 —556, 561, J, Problem reduction [A] 
题 归 约 
Regular expression 正则 表达 ，42，50 
defining pattern with 用 (正则 表达 式 ) 定 义 模式 ，54 -58 
equivalent 等 价 的 《正则 表达 ) ,53 
examples (正则 表达 式 的 ) 例子 ; 51 -53 
with squaring 用 扯 平 测 长 法 ，548 —550 
Regular grammar 正则 文法 ,81 一 83; 196 
finite automaton and, 有 限 自 动机 , 196 -.200 
Regular language 正则 语言 ，49，82; 200 
acceptance by finite automaton， 被 有 限 自动 机 接收 ， 
191 - 193 - 
closure properties of (正则 语言 的 ) 封闭 性 质 ， 
200 -203 
decision procedures for 用 于 | (正则 语言 的 ) HENE, 





209 -210 
generation by regular grammar 由 正则 文法 生成 ，198 - 199 
pumping lemma for 用 于 (正则 语言 ) 的 泵 引 理 ， 
205 -209 

Regular set 正则 集 ，49 -50 

finite automaton and 有 限 自动 机 和 (正则 集 ) , 191 — 193 
Relation 关系 

adjacency 邻接 (关系 ) 32 

binary 二 元 (KA), 11-12 

characteristic function of (KA) 的 特征 函数 , 299 

equivalence 等 价 (HA), 14 - 16 

n-ary n 元 关系 ，12 

Turing computable 图 灵机 可 计算 的 关系 ; 299 
Reversal of a string Bf, 45 
Rice's Theorem 3E3frzg 3, 371 - 373 
Right invariant equivalence relation 右 不 变 等 价 关系 , 212 
Right-linear grammar 右 线性 文法 ; 102, 219 
Rightmost derivation 最 右 推导 ，71 
Root ff, 33 
Rule Ail, 65, 326 

chain rule 链 规则 ，113 

context-free 上 下 文 无 关 (MIM), 65-66, 69 

和 -rule 入 -规则 ，69 

left-recursive 左 递归 (规则 ), 70, 129 

monotonic 单调 (规则 ) , 333 

null (H), 69 

of phrase-structure grammar 短语 构造 文法 (规则) , 326 

recursive 递归 (HLM), 67-68, 70 

regular 正则 (规则) 81 

right recursive 右 递归 (UM), 70, 130 

of semi-Thue system 半 图 厄 系统 规则 ，373 

of unrestricted grammar 无 限制 文法 规则 ，326 
Russell's paradox 罗素 悖 论 ，21 -23 


S 


Satisfiability Problem 可 满足 性 问题 ，4725 481 —483 

NP-completeness of (可 满足 性 问题 ) 的 NP- 完 全 ， 
483 -492 

Savitch's Theorem 萨 维 奇 定理 ，542 

Schróder-Bernstein Theorem 定理 ; 16 —17 

Search tree HR, 558 —561 

Self-reference Á 5| fH, 21-23, 363 - 364 

Semi-Thue system 半 图 厄 系统 ，373 -376 

Sentence 句子 ，65 -68, 70 


Sentential form 句 型 ，70 


terminal prefix of 句 型 的 终结 符 前 级 ，129 
Set 集合 ，8 -11 

cardinality of (集合 ) 的 势 ，16 -21 

complement (集合 ) 4h, 9 
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countable 可 数 (424), 7; 17-19 
countably infinite 可 数 无 穷 (集合 ) , 17-19 
denumerable 可 数 (424) , 17-19 
difference 差分 (#4), 9 
disjoint 不 相交 (集合 ) 9 
empty 空 (RA), 8 
equality 对 等 (RA), 8, 11 
infinite 无 穷 (集合 ) ，17 
intersection 交叉 (集合 ) , 9 
lookahead 预 读 (RA), 572, 575, 589 
partition 分 割 (集合 ) 9 
power E (484), 9, 20 
proper subset of 真子 ( 集 ) 9 
regular 正则 (484), 49 -50 
subset of F (42), 8 
uncountable 不 可 计算 (REAY, 7,17 
union Jf (42), 9 
Shift Bit, 556 
Simple cycle 简单 循环 ，33 
Simple induction 简单 归纳 30 
Space bounded Turing machine 空间 受 限 图 灵机 ,534 
Space complexity 空间 复杂 性 ，532 -535 
Speedup Theorem 加 速 定理 ，448 -451 
Stack f 
acceptance by empty stack 被 空 栈 接收 ，230 
alphabet 栈 字母 表 ，222 
Standard Turing machine 标准 图 灵机 ,255 -257 
State 状态 ，145 - 147 
accepting 接收 (状态 ) 147 
equivalent øt (RÆ), 178 
start 开始 (状态) 147, 256 
State diagram 状态 图 ，146 -147 
of deterministic finite automatoi ， 确 定 的 有 限 自 动机 的 
(状态 图 ) ，151 —153 
of multitape machine 多 带 机 的 (状态 图 ) 268 . 
of nondeterministic finite automaton 非 确 定型 的 有 限 自动 
机 的 (状态 图 ) 163 : 
of pushdown automaton 下 推 自动 机 的 (状态 图 )， 
222 =223 
of Turing machine 图 灵机 的 (状态 图 ), 254 
Strictly binary tree 严格 二 叉 树 ，35 -36 
String $, 41 -45 
accepted string 已 接收 的 串 ，148 224 
concatenation 连接 ，43:- 44 
derivable 可 推导 的 〈 串 ),-69 
homomorphism 同 态 ，219 ，257 
languages and 语言 和 ($), 41, 43 
length ( 69) 长 度 ，43 
lookahead 预 读 ($), 572 
nullZ: (8), 42 


prefix of (RAJ) Big, 45 
reversal (FRAY) 反 转 ，45 
substring 子 串 ，44 -45 
suffix of ( $) JGR, 45 
Strong induction 强 归 纳 ，30 
Strong LL(k) 3} LL(k) 
grammar (38 LL(k)) XE, 579 -580 
parser (38 LL(k) ) 分 析 器 ，587 -588 
Subset 子 集 ; 8 
Subset-Sum Problem 子 集 和 问题 ,473; 509 -513 
Substring 子 串 ，44 -45 
Successful computation 成 功 计算 ，224 
Suffix 后 缀 ，45 
Symbol 符号 
nonterminal 非 终结 (ff), 65, 69 
terminal 终结 (ff), 65 
useful 有 用 (fF), 116 
useless 无 用 (ff), 116 


T 


Tape 4, 147-148, 255 -256 
multitrack 多 道 ( 带 ) 263 = 265 
output 输出 ( 带 ) 282 -283 
two-way infinite 双向 无 穷 ( 带 )，265 =268 
Tape alphabet 带 字 母 表 , 256 
Tape number 带 数 字 , 416 
Terminal prefix 终结 符 前 级 ,129,，557 
Terminal symbol 终结 符 ，65 
Termination, abnormal 终结 ，257 
3-conjunctive normal form 3 - 合 取 范式 , 498 
3-Satisfiability Problem 3 - 可 满足 性 问题 ，498 —500 
reductions from 从 (3 = 可 满足 性 问题 ) JA, 500-513 
Time complexity 时 间 复 杂 性 ，442 -446 
nondeterminisitic 非 确 定型 的 (时间 复杂 性 ), 466 
properties of (时 间 复 杂 性 的 ) 特性 ，451 -458 
and representation (时 间 复 杂 性 ) 和 表示 法 ,469=471 
Token 符号 ,553,567 
Top-down parser 自 顶 向 下 分 析 器 ，555 
breadth-first 宽度 优先 〈 自 顶 向 下 分 析 器 )，557=3561 
LL(k) ( 自 顶 向 下 分 析 器 ) ，591 
strong LL(k) 9& LL(k)  ( 自 顶 向 下 分 析 器 )57587 —588 
Total function 全 函数 ，13 
Tour We, 359, 474 
Transition function 转换 函数 
of deterministic finite automaton 确定 性 有 限 自动 机 的 ( 转 
换 函 数 ) 147 
extended 扩展 的 〈 转 换 函 数 ) 151 
input (转换 函数 的 ) 输入 ，170 
multitape (转换 函数 的 ) 多 带 ，268 
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multitrack (转换 函数 的 ) 多 道 , 264 

of NFA-\ NFA-A 的 (转换 函数 )，166 

of nondeterministic finite automaton 非 确 定型 有 限 自动 机 
的 (转换 函数 )，163 

of nondeterministic Turing machine: 非 确定 型 图 灵机 的 
(FER PRA), 274 -275 

of pushdown automaton 下 推 自动 机 的 (转换 函数 )， 
222 -223 

of Turing machine 图 灵机 的 (转换 函数 ) , 256 

Transition table 状态 转换 表 , 150 

Traveling Salesman Problem 这 回 售货员 问题 ,517 =518 

approximation algorithm for 用 于 (巡回 售货员 问题 ) 的 
逼近 问题 ，521 -523 

Tree 树 ，33 

binary ZX. (fi), 35 

complete binary 完全 二 又 (f), 40 

derivation 推导 ($4), 71 -74 

frontier of (|) 的 边界 ，35 

ordered 有 序 ( 树 ) 33 -34 

search 搜索 ( 树 ) 558 -561 

strictly binary 严格 二 叉 (|), 35 -36 

Truth assignment 真 值 赋值 ，481 —482 

Turing computable 图 灵机 可 计算 的 

function (图 灵机 可 计算 ) PB, 296 

relation (图 灵机 可 计算 ) KR, 299 

Turing machine IRL, 2, 255 —257 

abnormal termination of (图 灵机 )! 的 异常 终止 ,296 

acceptance by entering 被 进入 方式 接收 ，263 ; 289, 

acceptance by final state 被 终结 状态 方式 接收 ,260 

acceptance by halting 被 停机 方式 接收 > 262 -263 

arithmetization of (图 灵机 ) 的 算术 化 , 416 =417 1 

atomic 原子 “(图 灵机 ), 290 

context-sensitive FF 3C432€ (的 图 灵机 )，290 

halting (图 灵机 的 ) FOL, 257 

Halting problem for 用 于 (图 灵机 的 站 停机 问题 *-3575 
362 -365 1 $ j 

as language acceptor 帮 为 语言 的 接收 器 ,259.-262 

as language enumerator 作为 语言 枚 举 器 ，282 =288 

linear speedup 线性 加 速 ,448 -451 

multitape machine 多 带 机 ;268 -274 

multitrack machine 多 道 机 ，263 一 265 

nondeterministic’ Turing machine 非 确定 型 图 灵机 ， 
274 -282 i 

sequential operation of (图 灵机 ) BERE, 301 —302 

space complexity 空间 复杂 性 , 532 -535 


standard 标准 (图 灵机 ) ，255 -257 

state diagram 状态 图 ; 257 

time complexity of (图 灵机 ) 的 时 间 复 杂 性 ,442=443， 
466 

two-way 双向 (图 灵机 ) 265 -268 

universal 通用 (图 灵机 )，354 -358 


Two-way Turing machine 双向 图 灵机 ,，265 -268 


U 


Unary representation 一 元 表示 ，299 
Uncomputable function 不 可 计算 的 函数 ，312 -313 
Uncountable set 不 可 数 集 , 了 ,17 


examples of (AFT REA) IF, 19 —20 


Undecidable problem 不 可 判定 的 问题 ，361 


Blank Tape Problem 空 带 问 题 ，366 -368 

for context-free grammars 关于 上 下 文 无 关 文法 的 ; 
382 -386 

Halting Problem 停机 问题 ，362 一 365 

Post Correspondence Problem 波斯 特 对 应 问题 ， 
377 -382 

Word Problem 词语 问题 ， 373 -376 


Union of sets 集合 的 并 ，9 

Universal Turing machine 通用 图 灵机 ，354 —358 
Unrestricted grammar 无 限制 文法 ,254, 325 =332 
Useful symbol 有 用 符号 ，116 

Useless symbol 无 用 符号 ; 116 


removal of (无 用 符号 ) 的 删除 ， 116-121 


V 


Variable 变量 


Boolean 布尔 5( 变 量 ) ，481 
of a grammar 文法 (Æ), 65, 68 —69 


^ nullable 可 空 (48H), 107 


teachable 可 达 :( 变 量 );=119 
recursive 递归 (变量 ) 71, 390 


Vertex Tie) 32; 1 i à 
Vertex Cover Problem 顶点 覆盖 问题 500 —503, 527 
Viable prefix 活 前 级 ;599 


ON 


Well-formed formula 合式 的 公式 ，481 
Word Problem 词语 问题 ，373 盖 376 


